本書以簡單易懂,簡單直白的敘述,帶領讀者認識資料分析與資料科學。每個主題都會以一個真實世界的案例帶入,希望能夠幫助讀者快速建立資料科學的概念。無論您是學生、上班族、行銷人員、分析師或財務人員,只要您對資料科學感到好奇,本書都可以幫助您對資料科學有更一步的認識。
來自各界的讚譽
「Maheshwari博士的這本著作是絕佳的資料分析入門簡介。他將概念解釋得十分清楚且切中要點,我特別喜歡關於決策樹和其發展流程的章節,他的說明非常清楚。」—Ramon A. Mata Toledo博士, 維吉尼亞州詹姆斯麥迪遜大學電腦科學系教授
「這本書為資料分析的主題做了精彩又有價值的補充。整本書的結構清晰,我毫無猶豫地推薦本書作為『商業智慧』和『資料探勘』相關主題的碩士課程教科書。」—Edi Shivaji博士
「隨著全世界進入大數據模式,這本書不但寫得好,而且時間也剛剛好!對於那些明白大數據是未來趨勢、但不知從何著手的外行管理階層來說,這是絕佳的橋梁和入門知識!」—Alok Mishra博士
「此書將一個複雜且非常重要的主題領域解釋得讓每個人都能理解,真的成就卓越。它簡單地從你所熟悉的概念開始切入,接著突然之間—你就發現了決策樹、迴歸模型和人工神經網路,還有集群分析、網路探勘和大數據的奧秘。」—Charmaine Oak女士
「結論就是,對於有興趣學習資料分析的任何人來說,這本書就是你學習的起點,希望它激發你對此領域的興趣,能夠掌握更深入的主題並提高技能。」—Keith S Safford
<序>
資料是新的石油,人工智慧是新的電力
資料是新的石油,人工智慧是新的電力。在這十年之間,資料分析與人工智慧仍然是最熱門的學科。此增訂版的內容比第一版多了大約40%,收錄了許多新的重要主題,例如資料隱私和人工智慧;針對忙碌的讀者,書中有一個摘要章節,用幾頁的篇幅將所有知識包含在50個要點中。這個版本收錄了一個很棒的樣本資料分析學生專案報告,使用了所有資料探勘技術來解決一個真正的社會相關問題,這對資料分析專業人士來說非常具有啟發性。
這次的增訂版更加靈活,因為內容經過更新,收錄了一些新技術的發展。資料倉儲的章節包含了資料湖的演變。迴歸章節也延伸並納入時間序列分析法。大數據的章節全部經過重新撰寫,以便展示其生態系統,以及這些技術如何解決大數據的4V。而且還收錄了有關統計、資料庫和人工智慧的入門知識,以協助將它們與資料分析聯繫起來。R的教學經過簡化。許多圖像或模型也經過重製,使它們更具吸引力。最後有一個摘要章節,以幫助讀者了解所有內容。
近十年來,我一直在教授資料分析和大數據的課程。我的學生發現其他教科書似乎太長、太技術化、太複雜或太專注於特定工具。我的目標是撰寫一本感覺輕鬆且內容豐富的對話書。這是一本通俗易懂的書,涵蓋了所有重要內容並附有具體範例,以邀請讀者深入探究此領域。許多人透過閱讀本書進入這個領域。任何因為業務或組織的需求而想了解資料相關決策的人,都可以在短時間內輕鬆閱讀本書,無需具備任何軟體工具方面的專業知識。文中幾乎完全沒有複雜的術語或程式碼。
這本書反映了我在學術界和工業界四個十年的全球IT經驗。這些章節是為典型的一學期碩士課程規劃的,每章的開頭都有來自真實故事的範例,並且有一個貫穿各章的案例研究作為練習。每章末尾都會有複習題。世界各地有許多大學都使用本書作為課程的教科書。本書依據評論者和學生的想法和建議,不斷改善。感謝許多評論者分享了許多改進的想法,我很高興能夠提供新版來激發學生和領域從業者。
感謝我的家人鼓勵並支持我撰寫和改進這本書,我也感謝我的學生和其他閱讀本書並提供回饋和建議的人。最後,感謝Maharishi Mahesh Yogi提供了一個以意識為本的美好教育環境,為本書的寫作提供了整體的靈感。
我們也祝福讀者擁有幸福和健康的生活。新冠病毒疫情已經持續兩年了,請採取一切的預防措施來維持安全和健康的作息。