<內容介紹>
這本書是基於R和Python的數據科學項目案例集錦,內容涵蓋了基於數據科學的所有要素,包括數據採集、處理、清洗、分析、建模、可視化以及數據產品的搭建。案例包含了汽車數據分析、股票市場建模、社交網絡分析、推薦系統、地理信息分析,以及Python代碼的計算優化。通過手把手的案例解析,令讀者知其然並知其所以然。業界的數據分析師、數據挖掘工程師、數據科學家都可以讀一讀。想要瞭解實際工作中如何用數據產生價值的在校學生,或者對數據科學感興趣的人也值得一讀。
<章節目錄>
簡介1
理解數據科學管道3
處理流程3
工作原理3
在Windows、Mac OS X、Linux上安裝R 5
準備工作5
處理流程5
工作原理7
參考資料7
在R和RStudio中安裝擴展包7
準備工作8
處理流程8
工作原理9
更多內容10
參考資料10
在Linux和Mac OS X上安裝Python 10
準備工作11
處理流程11
工作原理11
更多內容11
參考資料12
在Windows上安裝Python 12
處理流程13
工作原理13
參考資料14
在Mac OS X和Linux上安裝Python數據分析庫14
準備工作14
處理流程14
工作原理15
更多內容16
參考資料16
安裝更多Python包17
準備工作17
處理流程17
工作原理18
更多內容18
參考資料18
安裝和使用virtualenv 19
準備工作19
處理流程19
工作原理21
更多內容21
參考資料22
第2章汽車數據的可視化分析(R) 23
簡介23
獲取汽車燃料效率數據24
準備工作24
處理流程25
工作原理25
為了你的第一個項目準備好R 26
準備工作26
處理流程26
工作原理26
參考資料26
將汽車燃料效率數據導入R 27
準備工作27
處理流程27
工作原理28
更多內容29
參考資料30
探索和描述燃料效率數據30
準備工作30
處理流程30
工作原理32
更多內容33
進一步分析汽車燃料效率數據34
準備工作34
處理流程34
工作原理43
參考資料44
研究汽車的產量以及車型44
準備工作44
處理流程44
工作原理46
更多內容47
參考資料47
第3章模擬美式橄欖球比賽數據(R) 48
簡介48
準備工作49
獲取和清洗美式橄欖球比賽數據49
準備工作50
處理流程50
工作原理53
參考資料53
分析和理解美式橄欖球比賽數據53
準備工作53
處理流程53
工作原理61
更多內容61
參考資料62