深度強化學習——第六~八章Q-Learning

深度強化學習——第六~八章Q-Learning 1. Q-Learning concept 2. Q-Learning Function 2.1 State Value Function Estimation V π ( s ) V^{\pi}(s) Vπ(s) 2.2 State-action Value Function Q π ( s , a ) Q^{\pi}(s, a) Qπ(s,a)
相關文章
相關標籤/搜索