本書採用“問題描述+解決方案”模式,通過500個案例介紹了使用Pandas進行數據分析和數據處理的技術亮點。全書共分為8章,主要案例包括:讀寫CSV、Excel、JSON、HTML等格式的數據;根據行標簽、列名和行列數字索引篩選和修改數據,使用各種函數根據數據大小、日期範圍、正則表達式、lambda表達式、文本類型等多種條件篩選數據;統計NaN(缺失值)的數量、占比,根據規則填充和刪除NaN;在DataFrame中增、刪、查、改行列數據,計算各種行差、列差、極差以及直接對兩個DataFrame進行加、減、乘、除運算和比較差異;將寬表和長表相互轉換,創建交叉表和各種透視表;對數據分組結果進行求和、累加、求平均值、求極差、求占比、排序、篩選、重採樣等多種形式的分析,將分組數據導出為Excel文件。本書還附贈36個數據可視化案例,如根據指定的條件設置行列數據的顏色和樣式,根據行列數據繪制條形圖、柱形圖、餅圖、折線圖、散點圖、六邊形圖、箱形圖、面積圖等。 本書適於作為數據分析師、物流分析師、金融分析師、數據產品開發人員、人工智能開發人員、市場營銷人員、辦公管理人員、Python程序員等各行各業人員的案頭參考書,無論對於初學者還是專業人士,本書都極具參考和收藏價值。