深度加強學習David Silver(六)——Value Function Approximation

本節課主要內容:web Value Function Approximation Batch Methods Value Function Approximation 加強學習能夠用來解決大規模數據集的問題。在以前的問題中,咱們經過一個lookup表格來表現價值函數:每一個狀態都有一個特定值 V(s) ,或者每一個狀態-動做對都有一個特定值 Q(s,a) 看。在實際問題中,會遇到兩個限制:一般須要
相關文章
相關標籤/搜索