本書介紹數據分析的統計基礎、種類劃分,並列舉大量實例以說明數據分析方法和算法。內容主要分 為4部分,第1部分為第1章,介紹一些概念,簡單描述數據分析方法和一些實例; 第2部分包括第2~7 章,介紹描述性分析和數據預處理的主要方法,包括描述統計、多元描述分析、聚類以及頻繁模式挖掘等; 第3部分包括第8~12章,介紹預測性分析的主要方法,其中包括多種回歸算法、二元回歸、分類的性能測 量以及基於概率和距離測量的方法,以及決策樹、人工神經網絡和支持向量機等較為先進的方法; 第4部 分為第13章,利用描述和預測這兩種方法,簡單討論文本、網頁以及社交媒體的應用。