如果您曾被要求管理大型而複雜的Hadoop叢集,本書就是您必備的參考書。目前Hadoop已經成為資料中心中,真正能處理巨量資料的工業標準,因此針對系統管理的書籍需求也就逐日增加。本書作者是Cloudera的首席解決方案架構師,他將為您說明將Hadoop用於商業運轉的工作項目,從規劃、安裝到設定,甚至包括如何在上線期間進行維護。這本書並不談論空泛的理論,而是明確地指出,在商業佈署環境中,哪些是可行的方案。
.HDFS與MapReduce的巨觀概論:為何存在這類技術、背後的工作原理為何。
.佈署Hadoop的前期規劃,從硬體、作業系統挑選,到網路架構需求。
.學習Hadoop安裝與設定的細節,包括重要參數的完整列表。
.跨群組共享一座叢集時該如何管理資源。
.學習如何管理一般叢集運作的各種任務
.監控Hadoop叢集─並從現實世界的實例中,學習如何進行故障排解。
.使用基本的工具與技術來處理備份工作,以因應災難復原。