Deep Q-Learning深度增強學習算法

時間 2020-12-24

原文原文鏈接

DQN算法由於某些環境中狀態過多，通過傳統Q-learning的方法，維護一張規模巨大的Q表顯然是不現實的。DQN利用神經網絡代替了Q表，只需要通過對實際訓練的採樣數據進行訓練，就可以近似模擬Q表的數值初始化記憶庫D 初始化Q估計神經網絡 => Q_eval 初始化Q現實神經網絡 => Q_real For episode = 1 in M 初始化序列s_t = {x1, x2, … ,xn}

>>阅读原文<<