生成建模是 AI 最熱門的主題之一。現在已經能教導機器來達到媲美人類的水準,例如繪畫、寫作與作曲。本書可以幫助機器學習工程師與資料科學家理解如何重建生成深度學習模型中那些令人驚豔的範例,像是變分自動編碼器、生成對抗網路(GAN)、編碼器-解碼器模型與世界模型。
本書示範了各種技術的運作方式,從運用Keras說明深度學習的基礎概念開始,深入各領域的最頂尖技術。藉由各種提示與小技巧,幫助您理解如何讓模型的學習更有效率更有創意。
本書精彩內容
.如何使用變分自動編碼器來改變照片中的臉部表情
.從頭開始打造實用的 GAN 範例,包括用於風格轉換的 CycleGAN 與可生成音樂的 MuseGAN
.建立可生成文字的循環生成模型,並應用注意力機制來讓模型更厲害
.介紹為什麼生成模型有助於軟體代理在強化學習環境中達成各種任務
.介紹 Transformer (BERT, GPT-2)、ProGAN與StyleGAN 這類影像生成模型之架構
名人推薦
“想理解生成建模的各種深度學習工具的話,本書是絕佳的入門指南。如果你是喜歡修改程式碼且希望在作品中導入深度學習的創意實作派,本書一定適合你。”
—David Ha,Google Brain研究科學家
<序>
人類最獨特的能力之一就是創作能力。從最早期住在洞穴裡的人類,就開始不斷探索各種創作的可能性。
對早期人類來說,創作的型態就是各種野生動物與抽象圖案的洞穴壁畫,使用各種顏料仔細且有方法地畫在岩石上。浪漫主義時期把柴可夫斯基交響曲這樣的傑作帶來世上,這些音樂能透過聲波來傳達情感,引發我們的共鳴,交織在一起來形成美麗的旋律與合聲。而我們之所以會半夜跑進書店去買一本巫師小說,因為這些字母組合在一起之後所產生的敘述,會吸引我們翻到下一頁來看看書中的英雄發生了什麼事。
因此,無怪乎人類會有關於創造力的大哉問:我們是否能創造出具有創造力的東西?
這正是生成建模想要解答的問題。隨著近年來各種方法與技術上的進步,我們現在已經能做出各種機器來畫出指定風格的原創畫作、寫出具備長期性結構的流暢文章段落、創作出悅耳的音樂,以及透過生成幻想中的未來場景來發展出複雜的遊戲致勝策略。這只是生成革命的開端而已,使得我們別無選擇只能去追尋那些關於創造力如何運作的最大問題,至終則是追尋對於人類的意義。
要學習生成建模,沒有比現在更好的時機了,馬上在就開始吧!