Q-learning的進階版算法

文章目錄 Double DQN(DDQN) Dueling DQN 優先回放(Prioritized Experience Replay) N step bootstraping Noisy Net Distributional Q-function Rainbow Double DQN(DDQN) DQN的Q-value往往是被高估的,如下圖 上圖爲四個遊戲的訓練結果的對比。 橙色的曲線代表DQ
相關文章
相關標籤/搜索