Python資料分析必備套件!Pandas資料清理、重塑、過濾、視覺化 | 拾書所

Python資料分析必備套件!Pandas資料清理、重塑、過濾、視覺化

$ 741 元 原價 780
  【最齊全!徹底活用Pandas的114技】
 
  想學Pandas,看官方文件就夠了?
  對於Python使用者來說,Pandas無疑是資料分析的必備套件。有了Pandas,您可以非常高效地重塑、過濾、清理以及整合大部分類型的資料。的確,Pandas的官方網站提供了不同指令的使用範例。因此有的使用者會說:『不用買書看啦!網路資源這麼豐富,多看看官方文件就好了!』
 
  不過,單單只知道某個指令的運作方式是不足夠的。在實際進行資料分析時,您可能需要結合多個指令來達成目標。這時候,您更需要知道如何活用Pandas。舉例來說,假設您現在面對DataFrame的記憶體用量過大,導致無法順利分析資料的難題時,該怎麼辦呢?
 
  從Pandas的官方文件中,您可以了解轉換欄位型別的方法,也知道如何查詢欄位的浮點數精度。只要結合這兩個方法,您就可以非常輕鬆地降低DataFrame的記憶體用量。遺憾的是,官方文件並不會告訴您這個訣竅,而必須自己花時間來摸索。在摸索的過程中,不可避免地會多走許多彎路。
 
  本書並非單純的Pandas語法參考手冊。作者寫作此書時的目標,是希望讀者們可以從完整的範例中學習,並充分了解活用Pandas技巧的重要性。此外,作者習慣給出同一問題的不同解法,同時比較不同做法的效能。由此一來,讀者日後在實際分析資料時,才能知道哪一種做法是最優解。
 
  正面對決真實資料集!
  目前市面上的Pandas書籍,多數是使用亂數產生的假資料集來進行教學。這會導致您在面對真實資料集時,不知該從何下手。有鑒於此,本書作者使用了眾多的真實資料集,讓讀者切身感受資料分析師的工作內容。書中的資料集包含:
 
  ●IMDB 5000電影資料集
  ●Tesla股票資料集
  ●Kaggle問卷資料集
  ●鑽石品質資料集
  ●美國大學資料集
  ●美國國內航班資料集
  ●丹佛市的犯罪案件資料集 
  ●阿爾塔年積雪資料集
  ●美國燃油經濟資料集 
  …等
 
  最齊全的Pandas技巧教學!
  為了讓讀者可以更好的理解,書中每一小節的內容皆搭配完整範例。讀者可以從讀入資料集開始,循序漸進地搞懂資料分析的眉眉角角。全書共傳授了Pandas實戰的114種技巧,保證讀者可以全面掌握其中的精髓。讀者將會學到如何:
 
  ●處理資料集中的缺失值
  ●處理索引爆炸的問題
  ●組合多個Pandas物件
  ●在DataFrame中新增和刪除欄位
  ●取得特定欄位的統計資訊
  ●轉置DataFrame的運算方向
  ●減少DataFrame的記憶體用量
  ●混用位置和標籤來選取資料
  ●透過Pandas實現SQL的功能 
  ●對多個欄位進行分組及聚合運算
  ●將資料集重塑成整齊的形式
  ●過濾包含時間序列資料的欄位
  ●搭配Matplotlib和Seaborn來視覺化資料
  ●在Jupyter中進行Pandas程式碼的除錯
  …等
  
  如果您不想只是死記硬背Pandas語法,還想學習如何活用其中的技巧,非常歡迎您跟著書中的範例動手試試看,保證可以讓您的資料分析能力更上一層樓! 
 
本書特色
 
  ●全面採用最新的Pandas 1.x版本
  ●最齊全的Pandas教學,傳授114招實用技巧
  ●附有超過114個範例,還有多到無法細數的資料分析的寶貴經驗,從做中學才更有效
  ●使用真實世界中的資料集,累積實戰能力 
  ●搭配NumPy、Matplotlib、Seaborn、 Pandarallel、Great Expectations、pytest、Hypothesis 等工具,擴增你的武器庫
  ●完整說明CSV檔、JSON檔、SQL資料及HTML表格等資料類型的載入方式
  ●本書由施威銘研究室監修,書中針對原書進行大量補充,並適當添加註解,幫助讀者更好地理解內容

Brand Slider