強化學習總結(2)———DQN

上一篇總結了Q-Learning算法 https://blog.csdn.net/qq_37553152/article/details/88830319 Q-Learning算法對於一些小問題非常實用,但是遇到複雜的問題,狀態數變多,就會遇到效率低、受數據關聯性影響等問題。 於是DQN出現了,它在Q-Learning算法上做了修改,用神經網絡代替了Q-learning中的Q表,其輸入爲狀態,輸出
相關文章
相關標籤/搜索