David Silver強化學習課程筆記(八)(下)

第八課(下):基於Simulation的搜索方法         在《第八課(上):學習與規劃的結合》中,我們講到了Model-Based RL方法,在該方法中,我們首先擬合得到一個模型,然後可以利用各種規劃方法進行規劃,或者,可以引申出Sample-Based Planning,也即我們並不是去採用貝爾曼方程計算,而是用模型進行採樣,然後利用Model-Free方法進行學習。本文中要講的Simu
相關文章
相關標籤/搜索