本書較為全面地介紹了大數據開發技術平臺Hadoop及其生態系統的相關知識。全書共12章,包括Hadoop概述、大數據開發平臺Hadoop環境的搭建、Hadoop通用命令與編程原理、Hadoop分佈式文件存儲HDFS、作業調度與集群資源管理框架YARN、Hadoop分佈式計算框架MapReduce、Hadoop數據庫HBase、Hadoop數據倉庫Hive、Hadoop數據的快速通用計算引擎Spark,以及大數據應用開發綜合實例。本書從應用角度出發,重點培養學生應用大數據技術平臺Hadoop解決實際問題的能力。 本書內容新穎,簡明易懂,可操作性強,可作為普通高等學校、高職高專院校數據科學與大數據、軟件工程等電腦相關專業和信息管理類專業“大數據開發技術”課程的教材,也可作為大數據技術培訓的教材,還適合大數據技術研發人員和廣大電腦愛好者自學使用。