「作者在上市 IC 公司上班,每天面對 real world problems。探索如何建立輕量深度學習網路以及發展更有效率的學習方式是他每天的工作。這是一本學理及實務兼具的好工具書。」 - 中央研究院資訊科學研究所所長 廖弘源博士 推薦
[搭起 AI 與統計的橋樑]
原本統計學與人工智慧是兩個完全不同的領域,然而兩者在近代都有了新的發展進而產生連結。在人工智慧中導入機率與統計的觀念,讓電腦具有自己找出數據之間的關聯性並試圖解決問題的能力,因而出現機器學習 (machine learning) ,再加上電腦計算能力的大幅提升,解決多層類神經網路和大數據之間聯繫性的可能,進而衍生出現今最熱門的深度學習 (deep learning)。
不過,大部分電腦相關科系出身的人並不熟悉統計學,因此在更上一層樓的時候容易遇到障礙。有鑒於此,小編在推出《機器學習的數學基礎》(天瓏專業書店年度暢銷第一名) 一書之後,就積極開發 AI 與統計學相關的書籍。在尋尋覓覓之後請到擅長統計與機器學習的黃志勝博士出馬撰寫《機器學習的統計基礎》,首要之務就是讓讀者不要視統計為畏途,因此在書中設計大量範例以降低學習難度,務求讀得懂、做得出來才容易吸收,進而搭好統計與機器學習的橋樑。如果自覺數學已經還給老師了也不用擔心,可以將本書搭配《機器學習的數學基礎》一併完整學習。
[學會統計,由混亂到清晰]
本書從讀者在高中就學過的集合與機率論開始,帶您快速複習一遍,並將容易混淆之處多多舉例說明,並將以前似懂非懂的隨機變數、機率分布等觀念再解釋得更清楚。接下來就進入專有名詞特別多的統計學,這也是造成許多人暈頭轉向之處。特別是樣本估計、信賴區間、顯著水準、信心水準、t-分布、假設檢定...等讓人一個頭兩個大的主題,更是務求清楚明瞭。當然本書不可能把完整的統計學全都搬進來,此處只介紹機器學習、深度學習需要用到的統計基礎知識,縮短您的學習時間。
然後就進入機器學習的重頭戲,從資料前處理到迴歸、分類模型的建立,以及當數據的特徵數過多時的 PCA、LDA 統計降維法。從類神經網路開始進入深度學習的範疇,包括前向傳遞、梯度下降法與倒傳遞學習法的手算實作,幫助讀者一步步建立深度學習的演算邏輯,並利用參數常規化解決模型過擬合 (over-fitting) 的問題。最後,導入模型評估,例如二元、多元分類模型評估指標、迴歸模型評估指標、4 種交叉驗證的方法,做為判斷模型好壞的參考依據。
相信讀者認真看完本書後,一定能建立起機器學習結合統計學的硬底子。當然這只是開端,期望讀者以本書為基石繼續前行。
本書特色
1. 打好機率與統計的基礎,快速釐清讓人容易暈頭轉向的統計理論。
2. 藉由大量範例說明,務求讀得懂、做得出來,才容易吸收。
3. 作者提供專屬讀者天地,以及機器學習方面的文章供後續學習。