為使數據有用且有意義,必須對其進行整理和提煉。
本書將向讀者傳輸這些過程背後的所有核心思想,
並讓讀者掌握該領域中*通俗的工具和技術的相關知識。
本書從Python基礎知識開始,主要聚焦於數據結構,接著簡要介紹數據整理的基本工具NumPy和pandas庫,
之後介紹如何使用相同的Python後端從各種不同的數據源(如internet、大型數據庫或Excel財務表)中提取和轉換數據,
以及如何根據下游的分析工具需求,處理缺失或不正確的數據並重新格式化數據。
讀者將通過現實世界的示例和數據集學習這些相關概念。
*後,通過本書附錄中的活動練習,讀者將有足夠的信心來處理大量的數據源,有效地提取、清理、轉換和格式化數據。