DQN解決cartpole原理

時間 2021-01-07

標籤機器學習強化學習 DQN 莫凡python 欄目 Python 简体版

原文原文鏈接

標籤（）：機器學習文章目錄 @[toc] 爲什麼需要DQN DQN與Q學習？ DQN算法更新附錄（莫凡代碼）當學習狀態空間很大，例如圍棋的學習中，由於狀態空間過大導致Q表遠遠超過內存，所以在複雜學習情況下Q表更新並不適用。取而代之的是用神經網絡當做Q表使用，第一種神經網絡是輸入狀態和動作，輸出動作的評價值，第二種神經網絡是輸入狀態輸出所有動作和該動作的評價值，再從中選取評價高的動作進行決

>>阅读原文<<

相關文章

相關標籤/搜索

深刻理解mybatis原理

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<