“大數據”近年成為IT領域的熱點話題,人們每天都會通過互聯網、移動設備等產生大量數據。如何管理大數據、掌握大數據的核心技術、理解大數據相關的生態系統等,是作為大數據開發者必須學習和熟練掌握的。本系列書以“大數據開發者”應掌握的技術為主線,共分兩捲,以7個模塊分別介紹如何管理大數據生態系統、如何存儲和處理數據、如何利用Hadoop工具、如何利用NoSQL與Hadoop協同工作,以及如何利用Hadoop商業發行版和管理工具。本系列書涵蓋了大數據開發工作的核心內容,全面且詳盡地涵蓋了大數據開發的各個領域。
本書為第1捲,共4個模塊,分別介紹大數據基礎知識、大數據生態系統的管理、HDFS和MapReduce以及Hadoop工具(如Hive、Pig和Oozie等)。本書適用於想成為大數據開發者以及所有對大數據開發感興趣的技術人員和決策者閱讀。