DQN算法分析

轉載自:    http://blog.csdn.net/yeqiang19910412/article/details/76468407 Deep Q learning算法分析 Step 1: 用一個深度神經網絡來作爲Q值的網絡,參數爲ω  Q(s,a,ω)≈Qπ(s,a) Step 2: 在Q值中使用均方差mean-square error 來定義目標函數objective function也
相關文章
相關標籤/搜索