(David Silver深度強化學習) - Lecture1: Introduction to RL

時間 2020-12-29

原文原文鏈接

David Silver deep reinforcement learning course in 2019. For document and discussion. Lecture1：Introduction Outline Ⅰ The RL Problem 1.Reward reward R t R_t Rt 是一個標量的反饋信號表明agent的每一步的執行效果 agent目標：將累積

>>阅读原文<<