【轉載】David Silver公開課5——Model-Free Control

Model-Free Control(解決未知Environment下的Control問題) 本文是David Silver強化學習公開課第五課的總結筆記。這一課主要講了解決在未知policy未知environment的情況下control問題的兩種思路,即On-Policy和Off-Policy,在第四課的Monte-Carlo和Temporal Difference基礎上進行改進。 【轉載自】
相關文章
相關標籤/搜索