2. 強化學習方法彙總

強化學習方法彙總 通過理解環境分類 通過基於概率和價值分類 根據更新回合分類 根據在線和離線分類 通過理解環境分類 Model-Based 方法,機器人通過過往的經驗,理解真實世界的情況並建立一個模型來模擬現實世界。 Model-based 的方法具有想象力,可以通過想象來預判下一步的情況,根據想象中的情況選擇最好的一種,根據這種情況來做下一步的策略。 通過基於概率和價值分類 基於價值的選擇策略更
相關文章
相關標籤/搜索