隨著大數據時代的到來,企業資料每天都在急劇快速膨脹,如何發掘這些資料的價值,需要一種高效而穩定的分散式運算框架和模型。Spark恰逢其時,應運而生。本書對Spark進行詳細的闡述,包括核心模組和各個子系統,能讓Spark初學者快速瞭解和上手,是學習Spark的敲門磚,希望此書能讓更多的讀者去深入發掘Spark之美。
~~淘寶技術部資料採擷與計算團隊負責人 黃明(明風)
Apache Spark由於其基於記憶體的高性能計算模式以及豐富靈活的程式設計介面,得到廣泛的支援和應用,大有逐漸取代Hadoop MapReduce成為新一代大數據計算引擎的趨勢。本書從原始程式碼角度深入淺出地分析了Apache Spark及相關大數據技術的設計及實現,包含很多實戰經驗和使用心得。相信本書對於進行大數據、記憶體計算及分散式系統研究,Apache Spark的深入理解以及實際應用,都有很好的參考價值。
~~英特爾亞太研發有限公司技術總監 段建剛
適用:從事安防監控領域的應用開發和工程施工的技術人員。
作者簡介:
夏俊鸞 現任阿里巴巴資料平台部高級技術專家,Apache Spark項目Committer,曾就職於英特爾亞太研發中心,微博帳號@Andrew-Xia。
劉旭暉 現任蘑菇街資料平台資深架構師(花名天火),曾就職於英特爾亞太研發中心大資料軟體部,Spark/Hadoop/Hbase/Phoenix 等眾多大資料相關開源專案的積極貢獻者。
邵賽賽 英特爾亞太研發有限公司開發工程師,專注于大資料領域,現從事Spark相關工作,Spark代碼貢獻者。
程浩 英特爾大資料技術團隊軟體工程師,Shark和Spark SQL活躍開發者,致力於SQL on Big Data的性能最佳化。
史鳴飛 英特爾亞太研發有限公司大資料軟體部工程師,專注于大資料領域,現在主要投身於Tachyon項目的開發。
黃潔 目前就職於英特爾亞太研發中心大資料技術中心,擔任高級軟體工程師,是Apache Chukwa專案的PMC成員和Committer。