動態規劃問題 - 經典模型的狀態轉移方程

時間 2019-11-06

標籤動態規劃問題經典模型狀態轉移方程简体版

原文原文鏈接

狀態轉移方程

動態規劃中當前的狀態每每依賴於前一階段的狀態和前一階段的決策結果。例如咱們知道了第i個階段的狀態Si以及決策Ui，那麼第i+1階段的狀態Si+1也就肯定了。因此解決動態規劃問題的關鍵就是肯定狀態轉移方程，一旦狀態轉移方程肯定了，那麼咱們就能夠根據方程式進行編碼。html

在前面的文章《動態規劃-開篇》講到了如何設計一個動態規劃算法，有如下四個步驟：算法

一、刻畫一個最優解的結構特徵。數組

二、遞歸地定義最優解的值。ide

三、計算最優解的值，一般採用自底向上的方法。post

四、利用計算出的信息構造一個最優解。學習

對於肯定狀態轉移方程就在第一步和第二步中，首先要肯定問題的決策對象，接着對決策對象劃分階段並肯定各個階段的狀態變量，最後創建各階段的狀態變量的轉移方程。優化

例如用dp[i]表示以序列中第i個數字結尾的最長遞增子序列長度和最長公共子序列中用dp[i][j]表示的兩個字符串中前 i、 j 個字符的最長公共子序列，咱們就是經過對這兩個數字量的不斷求解最終獲得答案的。這個數字量就被咱們稱爲狀態。狀態是描述問題當前情況的一個數字量。首先，它是數字的，是能夠被抽象出來保存在內存中的。其次，它能夠徹底的表示一個狀態的特徵，而不須要其餘任何的輔助信息。最後，也是狀態最重要的特色，狀態間的轉移徹底依賴於各個狀態自己，如最長遞增子序列中，dp[x]的值由 dp[i](i < x)的值肯定。若咱們在分析動態規劃問題的時候可以找到這樣一個符合以上全部條件的狀態，那麼多半這個問題是能夠被正確解出的。因此說，解動態規劃問題的關鍵，就是尋找一個好的狀態。編碼

總結

下面對這幾天的學習總結一下，將我遇到的各類模型的狀態轉移方程彙總以下：url

一、最長公共子串

假設兩個字符串爲str1和str2，它們的長度分別爲n和m。d[i][j]表示str1中前i個字符與str2中前j個字符分別組成的兩個前綴字符串的最長公共長度。這樣就把長度爲n的str1和長度爲m的str2劃分紅長度爲i和長度爲j的子問題進行求解。狀態轉移方程以下：spa

dp[0][j] = 0; (0<=j<=m)
dp[i][0] = 0; (0<=i<=n)
dp[i][j] = dp[i-1][j-1] +1; (str1[i] == str2[j])
dp[i][j] = 0; (str1[i] != str2[j])

由於最長公共子串要求必須在原串中是連續的，因此一但某處出現不匹配的狀況，此處的值就重置爲0。

詳細代碼請看最長公共子串。

二、最長公共子序列

區分一下，最長公共子序列不一樣於最長公共子串，序列是保持子序列字符串的下標在str1和str2中的下標順序是遞增的，該字符串在原串中並不必定是連續的。一樣的咱們能夠假設dp[i][j]表示爲字符串str1的前i個字符和字符串str2的前j個字符的最長公共子序列的長度。狀態轉移方程以下：

dp[0][j] = 0; (0<=j<=m)
dp[i][0] = 0; (0<=i<=n)
dp[i][j] = dp[i-1][j-1] +1; (str1[i-1] == str2[j-1])
dp[i][j] = max{dp[i][j-1],dp[i-1][j]}; (str1[i-1] != str2[j-1])

詳細代碼請看最長公共子序列。

三、最長遞增子序列（最長遞減子序列）

由於二者的思路都是同樣的，因此只給出最長遞增子序列的狀態轉移方程。假設有序列{a1,a2,...,an}，咱們求其最長遞增子序列長度。按照遞推求解的思想，咱們用F[i]表明若遞增子序列以ai結束時它的最長長度。當 i 較小，咱們容易直接得出其值，如 F[1] = 1。那麼，如何由已經求得的 F[i]值推得後面的值呢？假設，F[1]到F[x-1]的值都已經肯定，注意到，以ax 結尾的遞增子序列，除了長度爲1的狀況，其它狀況中，ax都是緊跟在一個由 ai(i < x)組成遞增子序列以後。要求以ax結尾的最長遞增子序列長度，咱們依次比較 ax 與其以前全部的 ai(i < x)，若ai小於 ax，則說明ax能夠跟在以ai結尾的遞增子序列以後，造成一個新的遞增子序列。又由於以ai結尾的遞增子序列最長長度已經求得，那麼在這種狀況下，由以 ai 結尾的最長遞增子序列再加上 ax 獲得的新的序列，其長度也能夠肯定，取全部這些長度的最大值，咱們即能獲得 F[x]的值。特殊的，當沒有ai(i < x)小於ax，那麼以 ax 結尾的遞增子序列最長長度爲1。即F[x] = max{1,F[i]+1|ai<ax && i<x}。

詳細代碼請看最長遞增子序列。

四、最大子序列和的問題

假設有序列{a1,a2,...,an}，求子序列的和最大問題，咱們用dp[i]表示以ai結尾的子序列的最大和。

dp[1] = a1; (a1>=0 && i == 1)

dp[i] = dp[i-1]+ai; (ai>=0 && i>=2)

dp[i] = 0; (dp[i-1] + ai <=0 && i>=2)

詳細代碼請看最大子序列的和。

五、數塔問題（動態搜索）

給定一個數組data[n][m]構成一個數塔求從最上面走到最低端通過的路徑和最大。能夠假設dp[i][j]表示走到第i行第j列位置處的最大值，那麼能夠推出狀態轉移方程：

dp[i][j] = max{dp[i-1][j-1],dp[i-1][j]} + data[i][j];

for(i=n-1;i>=1;i--){

     for(j=1;j<=i;j++){

         dp[i][j]=max{dp[i-1][j-1],dp[i-1][j]}+s[i][j]

     }

}

View Code

六、（01）揹包問題

這是一個經典的動態規劃問題，另外在貪心算法裏也有揹包問題，至於兩者的區別在此就不作介紹了。

假設有N件物品和一個容量爲V的揹包。第i件物品的體積是v[i]，價值是c[i]，將哪些物品裝入揹包可以使價值總和最大？

每一種物品都有兩種可能即放入揹包或者不放入揹包。能夠用dp[i][j]表示第i件物品放入容量爲j的揹包所得的最大價值，則狀態轉移方程能夠推出以下：

dp[i][j]=max{dp[i-1][j-v[i]]+c[i],dp[i-1][j]};

  for (int i = 1;i <= N;i++) //枚舉物品  
    {  
        for (int j = 0;j <= V;j++) //枚舉揹包容量  
        {  
            f[i][j] = f[i - 1][j];  
            if (j >= v[i])  
            {  
                f[i][j] = Max(f[i - 1][j],f[i - 1][j - v[i]] + c[i]);  
            }  
        }  
    }

View Code

能夠參照動態規劃 - 0-1揹包問題的算法優化、動態規劃-徹底揹包問題、動態規劃-多重揹包問題

七、矩陣連乘（矩陣鏈問題）-參考《算法導論》

例如矩陣鏈<A1,A2,A3>,它們的維數分別爲10*100,100*5,5*50，那麼若是順序相乘即((A1A2)A3)，共需10*100*5 + 10*5*50 = 7500次乘法，若是按照(A1(A2A3))順序相乘，卻需作100*5*50 + 10*100*50 = 75000次乘法。二者之間相差了10倍，因此說矩陣鏈的相乘順序也決定了計算量的大小。

咱們用利用動態規劃的方式(dp[i][j]表示第i個矩陣至第j個矩陣這段的最優解,還有對於兩個矩陣A(i,j)*B(j,k)則須要i*j*k次乘法)，推出狀態轉移方程：

dp[i][j] = 0; (i ==j，表示只有一個矩陣，計算次數爲0)

dp[i][j] = min{dp[i][k] + dp[k+1][j] + p[i-1]*p[k]*p[j]}; (i<j && i<=k<j)

dp[1][n]即爲最終求解.

#define MAXSIZE 100

int dp[MAXSIZE][MAXSIZE];//存儲最小的就算次數
int s[MAXSIZE][MAXSIZE];//存儲斷點，用在輸出上面

int i, j, tmp；

for (int l = 2; l <= n; l++){//j-i的長度,因爲長度爲1是相同的矩陣那麼爲0不用計算
    for (i = 1; i <= n - l + 1; i++){//因爲j-i =l - 1 , 那麼j的最大值爲n，因此i上限爲 n - l+1;
        j = i + l - 1;//因爲j-i = l - 1 , 那麼j = l+i-1
        dp[i][j] = dp[i + 1][j] + r[i] * c[i] * c[j];//初始化，就是k = i；
        s[i][j] = i;
        for (k = i + 1; k < j; k++){//循環枚舉k i < k < j
            tmp = dp[i][k] + dp[k + 1][j] + r[i] * c[k] * c[j];
            if (dp[i][j] > tmp){
                dp[i][j] = tmp;//更新爲最小值
                s[i][j] = k;
            }
        }
    }
}

//遞歸調用輸出
void output(int i, int j){
    if (i == j){
        printf("A%d", i);//當兩個相等的時候就不用繼續遞歸就輸出A
        return;//返回上一層
    }

    else{
        printf("(");
        output(i, s[i][j]);
        printf(" x ");
        output(s[i][j] + 1, j);
        printf(")");
    }
}