Spark SQL是Spark大資料框架的一部分,支援使用標準SQL查詢和HiveQL來讀寫資料,可用於結構化資料處理,並可以執行類似SQL的Spark資料查詢,有助於開發人員更快地創建和運行Spark程式。
全書分為4篇,共9章,第一篇講解了Spark SQL發展歷史和開發環境搭建。第二篇講解了Spark SQL實例,使得讀者掌握Spark SQL的入門操作,瞭解Spark RDD、DataFrame和DataSet,並熟悉DataFrame各種操作。第三篇講解了基於WiFi探針的商業大資料分析專案,實例中包含資料獲取、預處理、存儲、利用Spark SQL挖掘資料,一步一步帶領讀者學習Spark SQL強大的資料採擷功能。第四篇講解了Spark SQL優化的知識。
本書適合Spark初學者、Spark資料分析人員以及Spark程式開發人員,也適合高校和培訓學校相關專業的師生教學參考。