David Silver強化學習公開課(八):整合學習與規劃

本課程以前全部的內容都沒有說起到個體如何構建一個模擬環境的模型,天然也沒有講解個體構建一個模擬環境的模型對於解決MDP問題有何幫助。本講即關注這兩個問題。經過構建一個模型,個體具有了必定程度的獨立思考能力,即在與環境發生實際交互以前思考各類可能的行爲其對能帶給環境及自身的改變。經過個體的思考以及聯合其與環境的實際交互經驗,個體在解決大規模MDP問題時能夠取得更好的結果。本講涉及的內容多屬於宏觀架構
相關文章
相關標籤/搜索