David Silver強化學習課程筆記(六)

第六課:值函數估計         好久沒有寫這個專欄了,現在來補一課,不然前面的都忘掉了~         本文主要討論值函數的估計問題,主要研究兩類方法:增量方法(Incremental Methods)、批方法(Batch Methods)。其中增量方法主要是從online方面考慮。批方法主要是從data efficient方面考慮。         在模型無關的預測中,我們介紹瞭如何對給定
相關文章
相關標籤/搜索