本書介紹強化學習基本算法以及前沿研究和應用。
強化學習基礎包括基於值函數和基於策略的算法。
前沿研究是本書的特色和主要部分,將分為六個章節,包括:
基於模型的強化學習、探索與利用、層次化強化學習、離線強化學習、強化學習中的表示學習、元強化學習。
強化學習前沿應用包括三個章節,分別介紹無人駕駛和導航、機械臂任務和星際爭霸遊戲智能體。
本書以構建完整的強化學習前沿理論為主,深入淺出的講解強化學習的各個研究分支,並闡述這些研究分支之間的聯繫。
對於前沿研究中的理論公式,將結合讀者閱讀科研文獻的經驗來進行直觀的講解,降低讀者閱讀的難度。
本書各章節之間彼此獨立又相互聯繫。