David silver 強化學習公開課筆記(三):Planning by Dynamic Programming

1 引言 動態規劃一開始我不是很理解,先看PPT上的解釋: 即是一個方法,把一個複雜的問題分解成子問題,通過綜合子問題的解來解決問題。我看了一個文章,說的不錯,也感覺理解的差不多了,鏈接:https://www.sohu.com/a/153858619_466939。 動態規劃問題滿足兩個性質: (1)最優子結構(Optimal substructure) (2)重疊子問題(Overlapping
相關文章
相關標籤/搜索