本書采用基於項目的方法,介紹用Python完成數據獲取、數據清洗、數據探索、數據呈現、數據規模化和自動化的過程。主要內容包括:Python基礎知 識,如何從CSV、Excel、XML、JSON和PDF文件中提取數據,如何獲取與存儲數據,各種數據清洗與分析技術,數據可視化方法,如何從網站和 API中提取數據。
Jacqueline Kazil,數據科學家,資深軟件開發者。活躍於Python軟件基金會、PyLadies等社區。曾參與美國總統創新伙伴項目,是美國政府技術組織18F的聯合創始人。曾擔任《華盛頓郵報》數據記者。
Katharine Jarmul,資深Python開發者,Py Ladies聯合創始人。喜歡數據分析和獲取、網頁抓取、教人學習Python以及Unix,期望通過教育和培訓來促進Python和其他開源語言的多元化。
Jacqueline Kazil,數據科學家,資深軟件開發者。活躍於Python軟件基金會、PyLadies等社區。曾參與美國總統創新伙伴項目,是美國政府技術組織18F的聯合創始人。曾擔任《華盛頓郵報》數據記者。
Katharine Jarmul,資深Python開發者,Py Ladies聯合創始人。喜歡數據分析和獲取、網頁抓取、教人學習Python以及Unix,期望通過教育和培訓來促進Python和其他開源語言的多元化。