強化學習（RLAI）讀書筆記第八章表格方法的規劃與學習

時間 2020-12-29

標籤強化學習 RLAI 简体版

原文原文鏈接

第八章：Planning and Learning with Tabular Methods 本章爲需要環境的model-based強化學習方法（如DP和啓發式搜索）和不需要環境的model-free方法（比如MC和TD）提供一個統一的論述框架。基於模型的方法依賴規劃（planning）而無模型的強化學習方法依賴學習（learning）。這兩種方式有很多不同也有很多相似點。特別的是這兩種方法都是以

>>阅读原文<<