強化學習筆記(3) Monte-Carlo和TD

3_Monte-Carlo_RL 文章目錄 1.1. 前言 1.1.1. 算法特性 1.1.2. 目標 1.2. 兩種Monte-Carlo 估計價值函數 1.2.1. First Visit 1.2.2. Every Visit 1.2.3. 小tips: Incremental Mean 1.3. Monte Carlo Control (Approximate optimal policie
相關文章
相關標籤/搜索