【轉載】David Silver公開課3——動態規劃解決MDP的Planning問題

本文是David Silver強化學習公開課第三課的總結筆記。主要談到了動態規劃能夠解決MDP的什麼問題,能通過Policy Iteration和Value Iteration來解決,這兩者指的是什麼,出於什麼樣的考慮提出這兩種思路,具體解決步驟是什麼。 【轉載自】chenrudan.github.io 本文是David Silver強化學習公開課第三課的總結筆記。主要談到了動態規劃能夠解決MDP
相關文章
相關標籤/搜索