強化學習導論（Reinforcement Learning：An Introduction）學習筆記（七）

時間 2019-12-06

標籤強化學習導論 reinforcement learning introduction 筆記欄目應用數學简体版

原文原文鏈接

Part I: 表格解決方法在本書的這一部分中，咱們以最簡單的形式描述了幾乎全部強化學習算法的核心思想：算法中的狀態和動做空間足夠小，能夠將近似值函數表示爲數組或表格。在這種狀況下，這些方法一般能夠找到確切的解決方案，也就是說，他們常常能夠找到最佳的價值函數和最優策略。這與本書下一部分描述的近似方法造成對比，後者只找到近似解，可是做爲回報能夠有效應用於更大的問題。web 本書的這一部

>>阅读原文<<