Hadoop 技術手冊 第二版 | 拾書所

Hadoop 技術手冊 第二版

$ 792 元 原價 880
您該如何釋放海量資料的力量呢?憑藉著本書的綜合資源,您可以學會如何用Apache Hadoop來打造與維護一個可靠而具擴充性的分散式系統。不論是想瞭解如何分析各種資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。本修訂版囊括了Hadoop近期的改變,包括像是Hive、Sqoop與Avro等。本書也提供了一些使用案例,用以說明Hadoop如何被用來解決特定的問題。

.用HDFS(Hadoop Distributed File System)來儲存大型資料集,然後用MapReduce運行分散式運算。
.用Hadoop的資料與I/O組成元件來進行壓縮、資料完整性驗證、序列化(serialization)與封藏(persistence)。
.探索在現實生活中,撰寫MapReduce程式常見的陷阱,以及進階的功能。
.設計、建立與管理一座專用的Hadoop叢集,或在雲端服務上運行Hadoop。
.運用高階的查詢語言Pig來處理大量資料。
.運用Hadoop的資料倉儲系統Hive來分析資料集。
.運用HBase資料庫來儲存結構化與半結構化資料。
.使用ZooKeeper工具集打造分散式系統。

Brand Slider