大數據:從基礎理論到最佳實踐 (電子書) | 拾書所

大數據:從基礎理論到最佳實踐 (電子書)

$ 359 元 原價 359
本書側重於大資料的實踐性技術,系統地介紹了主流大資料平臺及工具的安裝部署、管理維護和應用開發。平臺和工具的選擇均為當前業界主流的開源產品,因此,對於讀者來說,有很強的可操作性。 本書涉及的開源技術包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識、安裝部署、管理維護和應用開發技術外,還特別注重案例實踐,重要的技術點以實際工作場景或案例為依託,使讀者能快速入門,參考案例動手實踐,通過具體深入的實踐,體會大資料的技術本質特徵,領略大資料技術帶來的創新理念,更好地理解和把握資訊技術的發展趨勢。 本書主要內容包括以下幾大部分。 大資料存儲篇:以HDFS為基礎,介紹分散式檔案系統的原理、安裝、fs命令的使用、程式設計,介紹如何用HDFS實現,並通過HTTP調用。 大資料計算篇:以MapReduce、YARN為基礎,介紹分散式運算的原理、部署,以及程式設計案例。 非關係型數據庫篇:以HBase為基礎,重點介紹非關係型數據庫的優勢、原理、部署,以及命令行使用,程式設計案例,與Sqoop配合使用等。 大資料倉庫篇:以Hive、資料倉庫等為基礎,重點介紹資料的抽取、原理、部署、分析與程式設計。 大資料即時計算篇:以Storm、Kafka為基礎,介紹即時計算的架構、組成、使用與開發。 本書非常適合從事大資料技術開發與使用的初學者,以及從事大資料技術研發的企事業單位元元元工程師學習和參考,也適合高校電腦相關專業的專科生、本科生和研究生學習使用。

Brand Slider