強化學習主流算法特色總結

強化學習主流算法有Q-learning、Sarsa、Deep Q learning、Policy Gradients、Actor Critic等等,每種算法都有其特色。web 根據莫煩老師的教學視頻,將各個算法特色進行總結。方便本身以後科研工做中針對不一樣問題特色選擇算法,同時加深理解記憶。算法 RL算法總結 Q-learning Sarsa Sarsa-lambda Deep Q Network
相關文章
相關標籤/搜索