本書以新的Spark2.0為技術基礎,重點講解瞭如何構建機器學習系統以及如何實現機器學習流程的標準化,這兩點都是目前同類書中沒有的。第1~7章從概念、架構、算法等角度介紹了機器學習的基本概念;第8~12章以實例為主,詳細講解了機器學習流程標準化涉及的關鍵技術;第13章主要以在線數據或流式數據為主介紹了流式計算框架SparkStreaming;第14章重點講解了深度學習的框架TensorFlowOnSprak。此外,附錄部分提供了線性代數、概率統計及Scala的基礎知識,幫助讀者更好地學習和掌握機器學習的相關內容。