百度飛槳世界冠軍帶你從零實踐強化學習第三天（課程白話）

時間 2021-01-08

原文原文鏈接

冠軍帶你從零實踐強化學習第三天（課程白話）神經網絡方法求解 RL->Deep RL 數量逐漸增加到不可數值函數的近似神經網絡 Q-learning 使用神經網絡擬合Q表格監督式學習 DQN DQN兩大創新點 DQN算法使用流程作業問題環境的選擇代碼書寫參數修改大家好你們的三歲又回來啦，今天已經是第3天的課程啦，先說聲抱歉，沒有時間看直播，只能夠通過錄播去自己解讀，如果有不足的地方

>>阅读原文<<