強化學習入坑之路04

時間 2021-05-20

標籤我的博客神經網絡深度學習简体版

原文原文鏈接

強化學習入坑之路04 今天繼續強化學習的學習，這些內容的學習主要參考了李宏毅的強化學習教程，在此基礎上加入了個人的理解和總結。好，廢話少說下面開始進入正題。 1.Q-learning（DQN） State Value Function 首先我們要介紹的就是Q-learning的方法，Q-learning是一種value-based 的方法，在這一類的方法中我們不需要進行策略的學習，需要學習只是價值

>>阅读原文<<