Bourne強化學習筆記2:徹底搞清楚什麼是Q-learning與Sarsa

爲了理清強化學習中最經典、最基礎的算法——Q-learning,根據ADEPT的學習規律(Analogy / Diagram / Example / Plain / Technical Definition),本文努力用直觀理解、數學方法、圖形表達、簡單例子和文字解釋來展現其精髓之處。區別於衆多Q-learning講解中的僞代碼流程圖,本文將提供可視化的算法流程圖幫助大家學習、對比Q-learni
相關文章
相關標籤/搜索