百度飛槳世界冠軍帶你從零實踐強化學習第三天（課程白話）

時間 2020-07-20

標籤百度世界冠軍實踐強化學習第三天課程白話简体版

原文原文鏈接

冠軍帶你從零實踐強化學習第三天（課程白話）神經網絡方法求解 RL->Deep RL 數量逐漸增長到不可數值函數的近似神經網絡 Q-learning 使用神經網絡擬合Q表格監督式學習 DQN DQN兩大創新點 DQN算法使用流程做業問題環境的選擇代碼書寫參數修改你們好大家的三歲又回來啦，今天已是第3天的課程啦，先說聲抱歉，沒有時間看直播，只可以經過錄播去本身解讀，若是有不足的地方請

>>阅读原文<<