【轉載】David Silver公開課8——Integrating Learning and Planning

Integrating Learning and Planning(對Environment建立模型) 本文是David Silver強化學習公開課第八課的總結筆記。這一課主要講了如何擬合environment模型,通過有監督的方式來更新model,以及如何基於學習的model來找policy/value function,主要談到了Monte-Carlo Tree Search方法,並且將擬合m
相關文章
相關標籤/搜索