Q-Learning

時間 2021-01-25

原文原文鏈接

Q-Learning 什麼是 Q-learning？強化學習中的一種 values-based 算法，最終應是會學出一個收斂的表格 Q-Table。在Q-Learning的學習中，我們用Q(S, A)來表示value function.之前我們只討論了有限個狀態(state)和行動(action)的情況，這種情況下,我們其實等價於在不斷維護一個Q-table，不斷更新，直至其收斂。