實作現代強化學習方法：深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero…

強化學習（RL）的最新發展，結合使用深度學習（DL），在訓練代理人「像人類一樣地」解決複雜問題這方面，取得了前所未有的進步。Google團隊利用演算法來玩知名的Atari街機遊戲，並擊敗了它們，這可以說是讓RL領域發光發熱的重要推手，而世界各地的研究人員正馬不停蹄地研發各種新的想法。

《動手做深度強化學習》綜合性地介紹了最新的DL工具與它們的限制。讀者將評估包括交叉熵和策略梯度等方法，再把它們應用於真實的環境之中。本書使用Atari虛擬遊戲和一般家庭常玩的Connect4遊戲作為範例。除了介紹RL的基礎知識之外，作者亦詳述如何製作智慧型學習代理人等專業知識，讓讀者在面對一系列艱鉅的真實世界挑戰時，能游刃有餘。本書也會說明如何在網格世界（grid world）環境中實作Q學習、如何讓代理人學會買賣和交易股票，並學習聊天機器人是如何使用自然語言模型與人類對話的。

在這本書中，你將學到：
．了解結合了RL的DL內容，並實作複雜的DL模型
．學習RL的基礎：馬可夫決策過程
．評估RL方法，包括交叉熵、DQN、Actor-Critic、TRPO、PPO、DDPG、D4PG…等等
．了解如何在各種環境中處理離散行動空間和連續行動空間
．使用值迭代法來擊敗Atari街機遊戲
．建立屬於自己的OpenAI Gym環境，來訓練股票交易代理人
．使用AlphaGo Zero演算法，教你的代理人玩Connect4
．探索最新的深度RL研究主題，包括AI驅動的聊天機器人等等

下載範例程式檔案：
本書的程式碼是由 GitHub 託管，可以在如下網址找到：https://github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On。

下載本書的彩色圖片：
我們還提供您一個PDF檔案，其中包含本書使用的彩色螢幕截圖／彩色圖表，可以在此下載：https://static.packt-cdn.com/downloads/DeepReinforcementLearningHandsOn_ColorImages.pdf。

出版社

圖書專售

電商零售

動手做深度強化學習

出版社

圖書專售

電商零售

Site Breadcrumb

動手做深度強化學習

Brand Slider