隨著互聯網技術的發展,在新經濟的大時代背景下,各行各業都催生出眾多的全新業態。伴隨大數據、人工智能、區塊鏈等技術的加持,這些業態劃分也越來越精細,社會活動的整體效率也越來越高。然而,這一切都不開數據,特別是高質量的數據。本書圍繞智能數據分析與應用處理業務背景及相關技術,以學習情境的方式介紹了:數據分析工具Beautiful Soup與XPath和數據採集工具Requests;根據數據規模大小和格式,可採用Excel、Tabula或Kettle進行數據處理;數據分析工具NumPy、Pandas和可視化工具Matplotlib,通過Matplotlib進行數據可視化,使得NumPy、Pandas的處理結果更容易觀察、識別。通過基於機器學習算法模型的推薦系統的構建過程,介紹了主流的數據分析框架Spark;通過基於深度學習技術的人臉識別系統的構建過程,介紹了圖像數據的採集、處理、分析,並應用到神經網絡的整個過程,即從數據採集到應用的一個閉環過程。本書理論分析相對較少,側重於動手實踐,適用於應用型本科、高職高專大數據專業學生和希望快速進入大數據、機器學習、人工智能領域的讀者。