強化學習之DQN

參考:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/ DQN的兩大特色: Experience replay:經驗回放,Q-learning是一種off-policy離線學習方法,可以利用以前的經驗進行學習 Fixed Q-targets:打亂相關性,用到兩個結構相同,但架構不同的神經網
相關文章
相關標籤/搜索