強化學習(RLAI)讀書筆記第八章表格方法的規劃與學習

第八章:Planning and Learning with Tabular Methods 本章爲需要環境的model-based強化學習方法(如DP和啓發式搜索)和不需要環境的model-free方法(比如MC和TD)提供一個統一的論述框架。基於模型的方法依賴規劃(planning)而無模型的強化學習方法依賴學習(learning)。這兩種方式有很多不同也有很多相似點。特別的是這兩種方法都是以
相關文章
相關標籤/搜索