David Silver強化學習課程筆記(四)

第四課:模型無關的預測         在進入正題之前,先說點題外話哈,等《David Silver課程學習筆記》系列更新完成之後,我們將會更新《PRML學習筆記》以及《RL學習筆記》,到時候希望大家多多指教喲~           在第三課中,我們介紹了動態規劃方法(DP),提到DP既可用於預測,也可用於控制,但是不管怎麼說,這種方法總是離不開模型的:                我們需要知道
相關文章
相關標籤/搜索