Lecture 3: Planning by Dynamic Programming

1.利用動態序列或時間份量去最優化一個問題的程序算法

    它是解決複雜問題的一種方法,經過分解子問題,解決子問題,組合子問題的解來實現編程

2.動態編程是解決包含如下屬性問題的解決辦法:緩存

    1)最優子結構函數

         最優應用原則和最優解能被分解成子問題優化

    2)覆蓋子問題遞歸

         子問題出現屢次字符串

         子問題的解能夠被緩存和重複利用it

    3)MDP知足如下兩個屬性程序

         貝爾曼等式給出了遞歸分解形式方法

         值函數存儲和重複利用可行解

 3.DP一般用做如下問題:

      時序算法、字符串算法(序列對比)、圖算法(最短路徑)、圖模型(Viterbi algorithm)、生物信息學(晶格模型)

 4.策略迭代評估

相關文章
相關標籤/搜索