從零實踐強化學習之基於神經網絡方法求解RL(PARL)

前一節課講了表格法,這一節課主要講用神經網絡的方法來求解,這裏科老師也把神經網絡講的很透徹,讓我對神經網絡有了新的認識python 這是上節課的懸崖問題: 這些宮格都是可數的,用一個Q表格就能裝下來web 但是在實際生活中,有不少問題都是數量龐大,甚至不可數的: 這些狀態確定是不能被Q表格裝下的,這時就要用到值函數的近似算法 值函數近似(函數逼近) 值函數就是Q函數,Q表格的做用就是能夠根據輸入狀
相關文章
相關標籤/搜索