notes2-- 深度強化學習入門到熟練(Shusen Wang)

Value-based Learning 價值學習 回顧 Deep Q network (DQN) 使用神經網絡近似 Q ∗ Q^{*} Q∗ 函數 Approximate the Q Funcition DQN in Super Mario Temporal difference(TD) TD learning for DQN Summary
相關文章
相關標籤/搜索