強化學習總結（2）———DQN

時間 2021-01-02

原文原文鏈接

上一篇總結了Q-Learning算法 https://blog.csdn.net/qq_37553152/article/details/88830319 Q-Learning算法對於一些小問題非常實用，但是遇到複雜的問題，狀態數變多，就會遇到效率低、受數據關聯性影響等問題。於是DQN出現了，它在Q-Learning算法上做了修改，用神經網絡代替了Q-learning中的Q表，其輸入爲狀態，輸出

>>阅读原文<<