(David Silver深度強化學習) - Lecture1: Introduction to RL

David Silver deep reinforcement learning course in 2019. For document and discussion. Lecture1:Introduction Outline Ⅰ The RL Problem 1.Reward reward R t R_t Rt​ 是一個標量的反饋信號 表明agent的每一步的執行效果 agent目標:將累積
相關文章
相關標籤/搜索