近年來,機器學習受到了人們的廣泛關注。
本書面向普通大眾,指導讀者在Python(基於Chainer和OpenAI Gym)中實踐深度強化學習。
讀者只需要具備一些基本的編程經驗即可讀懂書中內容,通過實現具體程序來掌握深度強化學習的相關知識。
本書內容: 介紹深度學習、強化學習和深度強化學習的基本知識。
通過多種實際對戰遊戲(如太空侵略者、吃豆人)來介紹算法,如ε-greedy算法。
使用Anaconda設置本地PC,在倒立擺和老鼠學習問題中實現深度強化學習。
使用Python實現MNIST手寫數字分類任務。實現深度強化學習的基本算法DQN。
詳解繼DQN之後提出的新的深度強化學習技術(DDQN、PER-DQN、DDPG和A3C等)。