本書介紹強化學習基本算法以及前沿研究和應用。
強化學習基礎包括基於值函數和基於策略的算法。
前沿研究是本書的特色和主要部分，將分為六個章節，包括：
基於模型的強化學習、探索與利用、層次化強化學習、離線強化學習、強化學習中的表示學習、元強化學習。
強化學習前沿應用包括三個章節，分別介紹無人駕駛和導航、機械臂任務和星際爭霸遊戲智能體。
本書以構建完整的強化學習前沿理論為主，深入淺出的講解強化學習的各個研究分支，並闡述這些研究分支之間的聯繫。
對於前沿研究中的理論公式，將結合讀者閱讀科研文獻的經驗來進行直觀的講解，降低讀者閱讀的難度。
本書各章節之間彼此獨立又相互聯繫。

出版社

圖書專售

電商零售

強化學習

出版社

圖書專售

電商零售

Site Breadcrumb

強化學習

Brand Slider