Reinforcement Learning: value function approximation

introduction incremental methods增量法 state value function with prediction approximation action value function with control approximation batch methods批處理 introduction 上一節講到使用採樣的方法進行,狀態和action space都比較小
相關文章
相關標籤/搜索