強化學習之DQN

時間 2021-01-02

原文原文鏈接

參考：https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/ DQN的兩大特色： Experience replay：經驗回放，Q-learning是一種off-policy離線學習方法，可以利用以前的經驗進行學習 Fixed Q-targets：打亂相關性，用到兩個結構相同，但架構不同的神經網

>>阅读原文<<