本書結合案例研究講解Spark 在機器學習中的應用,並介紹如何從各種公開渠道獲取用於機器學習系統的數據。內容涵蓋推薦系統、回歸、聚類、降維等經典機器學習算法及其實際應用。第2版新增了有關機器學習數學基礎以及Spark ML Pipeline API 的章節,內容更加系統、全面、與時俱進。