2. 強化學習方法彙總

時間 2021-01-12

原文原文鏈接

強化學習方法彙總通過理解環境分類通過基於概率和價值分類根據更新回合分類根據在線和離線分類通過理解環境分類 Model-Based 方法，機器人通過過往的經驗，理解真實世界的情況並建立一個模型來模擬現實世界。 Model-based 的方法具有想象力，可以通過想象來預判下一步的情況，根據想象中的情況選擇最好的一種，根據這種情況來做下一步的策略。通過基於概率和價值分類基於價值的選擇策略更

>>阅读原文<<