DQN算法分析

時間 2021-01-07

原文原文鏈接

Deep Q learning算法分析 Step 1: 用一個深度神經網絡來作爲Q值的網絡，參數爲 ω Q(s,a,ω)≈Qπ(s,a) Step 2: 在Q值中使用均方差mean-square error 來定義目標函數objective function也就是loss function L(ω)=E[(r+γ⋅maxa,Q(s,,a,,ω)T

>>阅读原文<<