強化學習入坑之路04

強化學習入坑之路04 今天繼續強化學習的學習,這些內容的學習主要參考了李宏毅的強化學習教程,在此基礎上加入了個人的理解和總結。好,廢話少說下面開始進入正題。 1.Q-learning(DQN) State Value Function 首先我們要介紹的就是Q-learning的方法,Q-learning是一種value-based 的方法,在這一類的方法中我們不需要進行策略的學習,需要學習只是價值
相關文章
相關標籤/搜索