Q-Learning

Q-Learning 什麼是 Q-learning? 強化學習中的一種 values-based 算法,最終應是會學出一個收斂的表格 Q-Table。 在Q-Learning的學習中,我們用Q(S, A)來表示value function.之前我們只討論了有限個狀態(state)和行動(action)的情況,這種情況下,我們其實等價於在不斷維護一個Q-table,不斷更新,直至其收斂。
相關文章
相關標籤/搜索