內容簡介
資料科學家的實用統計學 第二版
內容簡介
運用R和Python學習50+個必學統計概念
「這本書並非是另一本統計學教科書,也不是機器學習手冊。本書透過清楚的解釋和豐富範例,將實用的統計術語及原理和當今資料探勘的行話及實務聯繫起來。對資料科學的初學者和老手來說,這都是一本非常出色的參考書。」
—Galit Shmueli, 暢銷書《Data Mining for Business Analytics》主要作者,台灣清華大學特聘教授
統計方法是資料科學很重要的部分,然而很少有資料科學家接受過正式的統計訓練,而一般的課程及書籍亦很少從資料科學的角度來講解基礎統計學。因此本書第二版新增了詳盡的Python範例,提供讀者如何將統計方法應用於資料科學的實用指南、如何避免誤用統計方法,以及該注意的建議。
資料科學的學習資源或多或少有採用統計方法,但卻缺乏更深入的統計觀點,如果你熟悉R或Python程式語言,並對統計學有所了解,那麼這本書將以易懂的方式來幫助你學習。
透過本書,你將會學習到:
‧為何探索式資料分析是資料科學關鍵的第一步
‧隨機抽樣如何減少偏誤,並產生更高品質的資料集
‧實驗設計的原理是如何針對問題得出明確的答案
‧如何使用迴歸來預測結果並檢測異常
‧用來預測紀錄所屬類別的重要分類方法
‧從資料中「學習」的統計機器學習方法
‧從無標籤資料中提取有意義訊息的非監督式學習方法
內容簡介
運用R和Python學習50+個必學統計概念
「這本書並非是另一本統計學教科書,也不是機器學習手冊。本書透過清楚的解釋和豐富範例,將實用的統計術語及原理和當今資料探勘的行話及實務聯繫起來。對資料科學的初學者和老手來說,這都是一本非常出色的參考書。」
—Galit Shmueli, 暢銷書《Data Mining for Business Analytics》主要作者,台灣清華大學特聘教授
統計方法是資料科學很重要的部分,然而很少有資料科學家接受過正式的統計訓練,而一般的課程及書籍亦很少從資料科學的角度來講解基礎統計學。因此本書第二版新增了詳盡的Python範例,提供讀者如何將統計方法應用於資料科學的實用指南、如何避免誤用統計方法,以及該注意的建議。
資料科學的學習資源或多或少有採用統計方法,但卻缺乏更深入的統計觀點,如果你熟悉R或Python程式語言,並對統計學有所了解,那麼這本書將以易懂的方式來幫助你學習。
透過本書,你將會學習到:
‧為何探索式資料分析是資料科學關鍵的第一步
‧隨機抽樣如何減少偏誤,並產生更高品質的資料集
‧實驗設計的原理是如何針對問題得出明確的答案
‧如何使用迴歸來預測結果並檢測異常
‧用來預測紀錄所屬類別的重要分類方法
‧從資料中「學習」的統計機器學習方法
‧從無標籤資料中提取有意義訊息的非監督式學習方法
內容目錄
目錄
第一章 探索式資料分析
第二章 資料和抽樣分布
第三章 統計實驗與顯著性檢驗
第四章 迴歸與預測
第五章 分類
第六章 統計機器學習
第七章 非監督式學習
參考書目
索引
第一章 探索式資料分析
第二章 資料和抽樣分布
第三章 統計實驗與顯著性檢驗
第四章 迴歸與預測
第五章 分類
第六章 統計機器學習
第七章 非監督式學習
參考書目
索引
ISBN: 9789865028411