本書是Python數據分析與挖掘領域的公認的事實標準,第1版銷售超過10萬冊,銷售勢頭依然強勁,被國內100餘所高等院校採用為教材,同時也被廣大數據科學工作者奉為經典。
作者在大數據挖掘與分析等領域有10餘年的工程實踐、教學和創辦企業的經驗,不僅掌握行業的最新技術和實踐方法,而且洞悉學生和老師的需求與痛點,這為本書的內容和形式提供了強有力的保障,這是本書第1版能大獲成功的關鍵因素。
全書共13章,分為三個部分,從技術理論、工程實踐和進階提升三個維度對數據分析與挖掘進行了詳細的講解。
第一部分 基礎篇(第1~5章)
主要講解了Python數據分析與挖掘的工具和技術理論,包括數據挖掘的基礎知識、Python數據挖掘與建模工具、數據挖掘的建模過程,以及挖掘建模的常用算法和原理等內容。
第二部分 實戰篇(第6~12章)
通過工程實踐案例講解了數據挖掘技術在金融、航空、零售、能源、製造、電商等行業的應用。在案例組織結構上,本書按照“介紹案例背景與挖掘目標→闡述分析方法與過程→完成模型構建”的順序進行,在建模過程關鍵環節,穿插程序實現代碼。最後,通過上機實踐加深對案例應用中的數據挖掘技術的理解。
第三部分 提高篇(第13章)
重點講解了基於Python引擎的開源數據挖掘建模平臺(TipDM)的功能和使用方法,以航空公司客戶價值分析為案例,介紹瞭如何使用該平臺快速搭建數據分析與挖掘工程。
本書不僅提供TipDM這樣的上機實踐環境,而且還提供配套的案例建模數據、Python源代碼、教學PPT。
在數字化轉型的時代大浪潮之下,數據已經成為新經濟的核心生產要素,如何向數據要價值和效率成為關鍵。數據分析與挖掘是一切數據工作的基礎,這也是為何相關崗位的從業人員供不應求的主要原因。
這本書第1版2015年出版,恰逢整個行業處於初始爆發期,加上本書作者在企業一線和教學一線有10餘年的經驗,不僅精通行業最新技術,而且深諳讀者需求,所以上市後在時代趨勢和優質內容的雙重加持下,取得了非常好的銷售成績。累計銷售已經超過10萬冊,而且銷售勢頭依然十分強勁,是該領域公認的經典著作。
第2版在第1版的基礎上做了較多的優化和補充,主要如下:
基於Python 3.6對全書代碼和相關內容進行了全面升級;
對部分不常用的知識點進行了刪減;
對一些新技術和知識點進行了補充;
對案例內容和寫作方式進行了優化;
採納了部分讀者對第1版提出的改進意見
……
通過這次升級,我們不僅希望給廣大讀者帶去更好的內容,同時也希望能呈現更好的閱讀體驗。