處理巨量資料(Big data)的最佳選擇
如果你正在尋找一個具可擴展性的儲存解決方案,來容納幾乎是永無止盡的大量資料,本書介紹的Apache HBase可以滿足你的需要。它是Google BigTable架構下的一個開放原始碼實作,HBase可以擴展到數十億筆資料和數百萬個欄位,同時確保寫入和讀取效能仍然保持一定的水準。針對許多IT人員經常提出的問題,本書提供了一些很有參考價值的解答。
.探索如何更緊密地與Hadoop整合,讓HBase可以更容易做到可擴展性。
.透過一個由一般伺服器所架設的低成本叢集,來散佈大型資料集。
.利用原生Java客戶端,或透過閘道伺服器所提供的REST、Avro或Thrift API來存取HBase。
.瞭解HBase的架構細節,包括儲存格式、預寫式日誌、背景程序等等。
.HBase整合Hadoop的MapReduce框架,用於大規模平行化的資料處理作業。
.學習如何去調校叢集、設計綱要、複製資料表、匯入大量資料、卸離節點和更多其他的工作。
名人推薦
「分散式系統通常最好是像〝雲〞一般。Lars George從實務中萃取出來的寶貴經驗,是我們在學習HBase過程中一個很好的引導。」—Josh Patterson, Cloudera
作者簡介:
Lars George是HBase提交者,目前於Cloudera擔任解決方案架構師一職,主要負責Hadoop和HBase的技術支援、顧問服務和教育訓練工作。曾經在多次Hadoop使用者會議和大型研討會上發表演說,像是在布魯塞爾市的開放原始碼開發者歐洲會議(FOSDEM,Free and Open Source Software Developers’ European Meeting)。