David Silver強化學習公開課(六):價值函數的近似表示

之前的內容都是講解一些強化學習的基礎理論,這些知識只能解決一些中小規模的問題,很多價值函數需要用一張大表來存儲,獲取某一狀態或行爲價值的時候通常需要一個查表操作(Table Lookup),這對於那些狀態空間或行爲空間很大的問題幾乎無法求解,而許多實際問題都是這些擁有大量狀態和行爲空間的問題,因此只掌握了前面5講內容,是無法較好的解決實際問題的。本講開始的內容就主要針對如何解決實際問題。 本講主要
相關文章
相關標籤/搜索