本書系統、全面地介紹大資料技術的基礎知識。全書共13章,首先介紹大資料行業與技術趨勢;然後介紹大資料生態圈的各項技術,包括分散式檔案系統、Hive分散式資料倉庫、HBase技術原理、MapReduce和YARN技術原理、Spark基於記憶體的分散式運算、Flink流批一體分散式即時處理引擎、資料獲取與資料裝載工具、Kafka分散式消息訂閱系統、高可靠集群安全模式、分散式全文檢索Elasticsearch、Redis記憶體中資料庫等;最後介紹華為大資料解決方案。通過學習本書所講內容,讀者可以整體瞭解大資料技術,掌握大資料生態圈中各項技術最為基礎和關鍵的知識。
本書可作為資料科學與大資料、軟體工程、電腦科學與技術等專業的大資料概論課程的教材,也可供大資料工程技術人員學習或參考使用,還可作為華為HCIA認證考試的培訓教材。