強化學習的一些算法

時間 2021-01-14

原文原文鏈接

參考資料：https://spinningup.openai.com/en/latest/spinningup/rl_intro2. 強化學習算法的種類 Model-Free vs Model-Based RL 強化學習算法的一個重要分支是：智能體是否有能力從環境學習一個模型。 Model-Based 優點：希望智能體能夠根據自己的思考做出計劃，可以觀測到可能的選擇值，並在選擇之間做出明確的決定。

>>阅读原文<<