Spark作為下一代大數據處理引擎,經過短短幾年的飛躍式發展,正在以燎原之勢席捲業界,現已成為大數據產業中的一股中堅力量。本書著重講解了Spark內核、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的核心概念與理論框架,並提供了相應的示例與解析。全書共分8章,其中前4章介紹Spark內核,主要包括Spark簡介、集群部署、工作原理、核心概念與操作等;後4章分別介紹Spark內核上的核心組件,每章系統地介紹Spark的一個組件,並附以相應的案例分析。本書適合作為高等院校電腦相關專業的研究生學習參考資料,也適合大數據技術初學者閱讀,還適合於所有願意對大數據技術有所瞭解並想要將大數據技術應用於本職工作的讀者閱讀。