4. Sarsa

Sarsa Sarsa與Q-Learning的區別 在Q-Learning算法當中未來的 Q ( s ′ , a ′ ) Q(s',a') Q(s′,a′) 是估計出來的, 而Sarsa的 Q ( S 2 , a 2 ) Q(S2,a2) Q(S2,a2)是計算出來的。 Q-Learning算法永遠在尋找離目標最近的一條道路, 而Sarsa算法尋找的是一條比較安全的道路。 原視頻: https:/
相關文章
相關標籤/搜索