強化學習基礎 | (18) 基於模擬的搜索與蒙特卡羅樹搜索(MCTS)

原文地址 在基於模型的強化學習與Dyna算法框架中,我們討論基於模型的強化學習方法的基本思路,以及集合基於模型與不基於模型的強化學習框架Dyna。本文我們討論另一種非常流行的集合基於模型與不基於模型的強化學習方法:基於模擬的搜索(Simulation Based Search)。 本篇主要參考了UCL強化學習課程的第八講,第九講部分。 1. 基於模擬的搜索概述 什麼是基於模擬的搜索呢?當然主要是兩
相關文章
相關標籤/搜索