各種DQN

Q-learning     DQN 論文:Human-level control through deep reinforcement learning DQN其實就是將深度學習與Q-learning結合起來了,建立了卷積神經網絡來估計Q值。        建立了Q network,Q target network( Q̂  )兩個網絡,對每一個episode,t時刻時,對於狀態 st ,利用
相關文章
相關標籤/搜索