David Silver強化學習課程筆記(八)(下)

第八課(下):基於Simulation的搜索方法         在《第八課(上):學習與規劃的結合》中,咱們講到了Model-Based RL方法,在該方法中,咱們首先擬合獲得一個模型,而後能夠利用各類規劃方法進行規劃,或者,能夠引伸出Sample-Based Planning,也即咱們並非去採用貝爾曼方程計算,而是用模型進行採樣,而後利用Model-Free方法進行學習。本文中要講的Simul
相關文章
相關標籤/搜索