強化學習筆記(7)基於模型的RL / Dyna算法/ MCTS

文章目錄 Introduction model-Free Model-Based RL Advantages Disadvantages Model定義 目標 一些模型表示方法: 計劃 Planning Sample-Based Planning 基於採樣的計劃 整合Model-Free 和 Model-Based 兩種經驗來源: Dyna 基於模擬的搜索 前向搜索算法 Foward Search
相關文章
相關標籤/搜索