強化學習(2):Sarsa 算法及 Sarsa(lambda) 算法

最近自己會把自己個人博客中的文章陸陸續續的複製到CSDN上來,歡迎大家關注我的 個人博客,以及我的github。 本文主要講解 Sarsa 算法以及 Sarsa( λ \lambda λ) 算法的相關內容,同時還會分別附上一個莫煩大神寫的例子。 一、Sarsa 算法 Sarsa 算法與 Q-Learning 算法相似,也是利用 Q 表來選擇動作,唯一不同的是兩者 Q 表的更新策略不同。該算法由於更
相關文章
相關標籤/搜索