七月算法強化學習 第四課 學習筆記

Deep Q-Network 1.複習Q值函數 SARSA 2.Q-Learning  如果(s,a)狀態太多太複雜怎麼辦?(圍棋、Atari遊戲,星際爭霸) 擬合值函數Q(s,a) 幾種值函數逼近(Value Function Approximation) 值函數 Linear Combination of Features  Neural Network  Decision Tree  Nea
相關文章
相關標籤/搜索