Model-Based RL-基於模型的強化學習-理論詳解1：最優控制和規劃問題（Optimal Control and Planning）/ CEM/MCTS/LQR

時間 2021-01-07

標籤強化學習RL 简体版

原文原文鏈接

文章目錄 1. MB概念引出 1.1 概念 1.2 MB三個階段 2. Optimal Control and Planning 2.1 三種情況概念辨別closed-loop和open-loop 1. Deterministic情況下open-loop 2. 隨機開循環Stochastic open-loop case 3. 隨機閉循環 2.2 優化問題問題抽象 2.3 優化方法 2.3.1

>>阅读原文<<