強化學習的一些算法

參考資料:https://spinningup.openai.com/en/latest/spinningup/rl_intro2. 強化學習算法的種類 Model-Free vs Model-Based RL 強化學習算法的一個重要分支是:智能體是否有能力從環境學習一個模型。 Model-Based 優點:希望智能體能夠根據自己的思考做出計劃,可以觀測到可能的選擇值,並在選擇之間做出明確的決定。
相關文章
相關標籤/搜索