1.利用動態序列或時間份量去最優化一個問題的程序算法
它是解決複雜問題的一種方法,經過分解子問題,解決子問題,組合子問題的解來實現編程
2.動態編程是解決包含如下屬性問題的解決辦法:緩存
1)最優子結構函數
最優應用原則和最優解能被分解成子問題優化
2)覆蓋子問題遞歸
子問題出現屢次字符串
子問題的解能夠被緩存和重複利用it
3)MDP知足如下兩個屬性程序
貝爾曼等式給出了遞歸分解形式方法
值函數存儲和重複利用可行解
3.DP一般用做如下問題:
時序算法、字符串算法(序列對比)、圖算法(最短路徑)、圖模型(Viterbi algorithm)、生物信息學(晶格模型)
4.策略迭代評估