Deep Q-Learning深度增強學習算法

DQN算法 由於某些環境中狀態過多,通過傳統Q-learning的方法,維護一張規模巨大的Q表顯然是不現實的。DQN利用神經網絡代替了Q表,只需要通過對實際訓練的採樣數據進行訓練,就可以近似模擬Q表的數值 初始化記憶庫D 初始化Q估計神經網絡 => Q_eval 初始化Q現實神經網絡 => Q_real For episode = 1 in M 初始化序列s_t = {x1, x2, … ,xn}
相關文章
相關標籤/搜索