David Silver強化學習課程 Lecture 2: Markov Decision Processes

時間 2020-12-29

原文原文鏈接

文章目錄 Abstract 1. Markov Property 2. Markov Chain 2.1. Example：Student Markov Chain 3. Markov Reward Process 3.1. Example: Student Markov Reward Process 3.2. Return（回報） 3.3. Value function 3.3.1. Examp