本書以理論和實踐相結合的形式深入淺出地介紹強化學習的歷史、基本概念、經典算法和一些前沿技術,共分為三大部分:
一部分(1~5章)介紹強化學習的發展歷史、強化學習的基本概念以及一些經典的強化學習算法;
二部分(6~9章)在簡要回顧深度學習技術的基礎上著重介紹深度強化學習的一些前沿實用算法;
三部分(後一章)以五子棋為例詳細講解戰勝了人類圍棋選手的Alpha Zero算法的核心思想。葉強 閆維新 黎斌
本書以理論和實踐相結合的形式深入淺出地介紹強化學習的歷史、基本概念、經典算法和一些前沿技術,共分為三大部分:
一部分(1~5章)介紹強化學習的發展歷史、強化學習的基本概念以及一些經典的強化學習算法;
二部分(6~9章)在簡要回顧深度學習技術的基礎上著重介紹深度強化學習的一些前沿實用算法;
三部分(後一章)以五子棋為例詳細講解戰勝了人類圍棋選手的Alpha Zero算法的核心思想。葉強 閆維新 黎斌