「大數據會消失,資料科學不會」
「所有的科學都是資料科學」
―――東京大學松尾豐研究室人氣講座書籍化―――
★東京大學為期2年、超過1800人報名、400人上課的課程講義,資料科學家基礎講座!
★使用Python學習基本的程式撰寫,邊做邊學,培養資料科學技能!
★收錄大量練習題和綜合題演練,打好理論基本功,具體應用於實務現場!
★體驗資料科學的魅力,培養整合跨領域課題的創造力!
本書廣泛說明資料科學不可不知的基礎事項,蒐羅豐富的重要關鍵知識和好用的參考資料,希望成為學習資料科學這門學科的地圖與羅盤。
書中主要使用Python來學習基本的程式撰寫技巧,以及資料的取得、讀取、操作等,含括各式各樣Python函式庫的使用方式、機率統計的手法、機器學習(監督式學習、非監督式學習、效能調校),還有讓Python高速化的方法和Spark的簡單操作等。操作的資料包括市場行銷的資料和紀錄、金融的時間序列資料等,並介紹將它們模型化之前的加工手法。對於有志成為資料科學家的讀者來說,透過本書,能夠學習不可或缺的必備技能。只要能培養基本的思考方式與知識,即使面對未知的問題,也可以一邊研究一邊學習。
此外,本書說明如何實際將現場的資料進行加工與分析,如何具體運用於市場行銷或金融等,使用何種手法來撰寫程式比較好,以及組合那些程式的技巧和流程。除了理論解說,也介紹實務性的使用方法,可立即上手應用。
一般的市場行銷書籍,以市場行銷的手法為中心而缺乏實作方法;另一方面,機器學習的書籍雖然介紹了理論與實作,但未說明市場行銷的手法等實務性的使用方式,大多為某個特定領域的專門書籍。本書整體網羅了對於資料科學來說必不可少的課題,還能立即嘗試實作。
另外一大特點是,書中收錄大量實作的練習題,以實際的問題為前提來思考並動手實踐。馬上學,馬上練,馬上懂!
◎本書的出版緣由
本書以東京大學2017年至2018年的「全球消費者情報捐贈講座」(グローバル消費インテリジェンス寄付講座)講義和線上課程教材為基礎,用簡潔易懂的形式彙整編纂而成。
這個廣受歡迎的熱門講座首度書籍化,原因有三:
首先,希望讓更多讀者了解資料科學,培養資料分析技能。資訊時代各行各業都需要資料分析的人才,了解應該具備哪些知識、有何種處理手法、能達成什麼樣的目標,善用資料科學將是致勝的關鍵。
其次,雖然線上資源豐富又方便取得,但並非隨時都能在線上學習。藉由書籍的形式,可因地制宜反覆演練複習。
第三,以學習效果來說,書本的編排有助於深入思考,成效更佳。
◎本書的目標讀者
˙以有程式設計經驗、完成理科大一大二程度數學者為對象,以及對資料科學有高度學習意願的一般人士
˙藉由本書,可掌握資料科學入門程度至中級程度的內容,已達中級程度以上的讀者也能參酌本書來複習資料分析相關知識
˙對於目前備受矚目的深度學習,可透過本書掌握學習深度學習之前必需的基礎技能
◎本書的目的
所謂的科學,是從世界上混沌的現象裡找出本質,逐步解決各種問題。從日漸龐大的資料當中,使用科學的力量,解決各式各樣問題的,便是資料科學。
資料科學不僅只是數學(統計、機率、機器學習等),更借用了IT等各種力量,不斷挑戰世界上的難題與背後課題的綜合領域。
活用這樣資料科學和人工智慧的力量,減少浪費與沒有效率的事物,進一步創造出新價值,讓這個世界更加美好。