轉【算法之動態規劃(一)】動態規劃(DP)詳解

1、基本概念算法

 

動態規劃(dynamic programming)是運籌學的一個分支,是求解決策過程(decision process)最優化的數學方法。20世紀50年代初美國數學家R.E.Bellman等人在研究多階段決策過程(multistep decision process)的優化問題時,提出了著名的最優化原理(principle of optimality),把多階段過程轉化爲一系列單階段問題,利用各階段之間的關係,逐個求解,創立了解決這類過程優化問題的新方法——動態規劃。1957年出版了他的名著《Dynamic Programming》,這是該領域的第一本著做。編程

 

 動態規劃過程是:每次決策依賴於當前狀態,又隨即引發狀態的轉移。一個決策序列就是在變化的狀態中產生出來的,因此,這種多階段最優化決策解決問題的過程就稱爲動態規劃。數組

2、基本思想與策略網絡

    基本思想與分治法相似,也是將待求解的問題分解爲若干個子問題(階段),按順序求解子階段,前一子問題的解,爲後一子問題的求解提供了有用的信息。在求解任一子問題時,列出各類可能的局部解,經過決策保留那些有可能達到最優的局部解,丟棄其餘局部解。依次解決各子問題,最後一個子問題就是初始問題的解。框架

    因爲動態規劃解決的問題多數有重疊子問題這個特色,爲減小重複計算,對每個子問題只解一次,將其不一樣階段的不一樣狀態保存在一個二維數組中。優化

    與分治法最大的差異是:適合於用動態規劃法求解的問題,經分解後獲得的子問題每每不是互相獨立的(即下一個子階段的求解是創建在上一個子階段的解的基礎上,進行進一步的求解)。spa

 

區別:.net

(1)動態規劃和分治區別:設計

動態規劃算法:它一般用於求解具備某種最優性質的問題。在這類問題中,可能會有許多可行解。每個解都對應於一個值,咱們但願找到具備最優值的解。動態規劃算法與分治法相似,其基本思想也是將待求解問題分解成若干個子問題,先求解子問題,而後從這些子問題的解獲得原問題的解。與分治法不一樣的是,適合於用動態規劃求解的問題,經分解獲得子問題每每不是互相獨立的。code

分治法:若用分治法來解這類問題,則分解獲得的子問題數目太多,有些子問題被重複計算了不少次。若是咱們可以保存已解決的子問題的答案,而在須要時再找出已求得的答案,這樣就能夠避免大量的重複計算,節省時間。咱們能夠用一個表來記錄全部已解的子問題的答案。

注:無論該子問題之後是否被用到,只要它被計算過,就將其結果填入表中。這就是動態規劃法的基本思路。

 


 

3、適用的狀況

能採用動態規劃求解的問題的通常要具備3個性質:

    (1) 最優化原理:若是問題的最優解所包含的子問題的解也是最優的,就稱該問題具備最優子結構,即知足最優化原理。

    (2) 無後效性:即某階段狀態一旦肯定,就不受這個狀態之後決策的影響。也就是說,某狀態之後的過程不會影響之前的狀態,只與當前狀態有關。

   (3)有重疊子問題:即子問題之間是不獨立的,一個子問題在下一階段決策中可能被屢次使用到。(該性質並非動態規劃適用的必要條件,可是若是沒有這條性質,動態規劃算法同其餘算法相比就不具有優點)

 


4、求解的基本步驟

     動態規劃所處理的問題是一個多階段決策問題,通常由初始狀態開始,經過對中間階段決策的選擇,達到結束狀態。這些決策造成了一個決策序列,同時肯定了完成整個過程的一條活動路線(一般是求最優的活動路線)。如圖所示。動態規劃的設計都有着必定的模式,通常要經歷如下幾個步驟。

    初始狀態→│決策1│→│決策2│→…→│決策n│→結束狀態

                      圖1 動態規劃決策過程示意圖

    (1)劃分階段:按照問題的時間或空間特徵,把問題分爲若干個階段。在劃分階段時,注意劃分後的階段必定要是有序的或者是可排序的,不然問題就沒法求解。

    (2)肯定狀態和狀態變量:將問題發展到各個階段時所處於的各類客觀狀況用不一樣的狀態表示出來。固然,狀態的選擇要知足無後效性。

    (3)肯定決策並寫出狀態轉移方程:由於決策和狀態轉移有着自然的聯繫,狀態轉移就是根據上一階段的狀態和決策來導出本階段的狀態。因此若是肯定了決策,狀態轉移方程也就可寫出。但事實上經常是反過來作,根據相鄰兩個階段的狀態之間的關係來肯定決策方法和狀態轉移方程。

    (4)尋找邊界條件:給出的狀態轉移方程是一個遞推式,須要一個遞推的終止條件或邊界條件。

    通常,只要解決問題的階段、狀態和狀態轉移決策肯定了,就能夠寫出狀態轉移方程(包括邊界條件)。

實際應用中能夠按如下幾個簡化的步驟進行設計:

    (1)分析最優解的性質,並刻畫其結構特徵。

    (2)遞歸的定義最優解。

    (3)以自底向上或自頂向下的記憶化方式(備忘錄法)計算出最優值

    (4)根據計算最優值時獲得的信息,構造問題的最優解

 


5、算法實現的說明

    動態規劃的主要難點在於理論上的設計,也就是上面4個步驟的肯定,一旦設計完成,實現部分就會很是簡單。

     使用動態規劃求解問題,最重要的就是肯定動態規劃三要素:

    (1)問題的階段 (2)每一個階段的狀態

    (3)從前一個階段轉化到後一個階段之間的遞推關係。

     遞推關係必須是從次小的問題開始到較大的問題之間的轉化,從這個角度來講,動態規劃每每能夠用遞歸程序來實現,不過由於遞推能夠充分利用前面保存的子問題的解來減小重複計算,因此對於大規模問題來講,有遞歸不可比擬的優點,這也是動態規劃算法的核心之處。

    肯定了動態規劃的這三要素,整個求解過程就能夠用一個最優決策表來描述,最優決策表是一個二維表,其中行表示決策的階段,列表示問題狀態,表格須要填寫的數據通常對應此問題的在某個階段某個狀態下的最優值(如最短路徑,最長公共子序列,最大價值等),填表的過程就是根據遞推關係,從1行1列開始,以行或者列優先的順序,依次填寫表格,最後根據整個表格的數據經過簡單的取捨或者運算求得問題的最優解。

          f(n,m)=max{f(n-1,m), f(n-1,m-w[n])+P(n,m)}

 

 


6、動態規劃算法基本框架

 1 for(j=1; j<=m; j=j+1) // 第一個階段
 2    xn[j] = 初始值;
 3 
 4  for(i=n-1; i>=1; i=i-1)// 其餘n-1個階段
 5    for(j=1; j>=f(i); j=j+1)//f(i)與i有關的表達式
 6      xi[j]=j=max(或min){g(xi-1[j1:j2]), ......, g(xi-1[jk:jk+1])};
 8 
 9 t = g(x1[j1:j2]); // 由子問題的最優解求解整個問題的最優解的方案
10 
11 print(x1[j1]);
12 
13 for(i=2; i<=n-1; i=i+1)
15 {  
17      t = t-xi-1[ji];
18 
19      for(j=1; j>=f(i); j=j+1)
21         if(t=xi[ji])
23              break;
25 }
 

例 最短路徑問題

如圖,給定一個運輸網絡,兩點之間連線上的數字表示兩點間的距離。試求一條從A到E的運輸路線,使總距離最短。

從圖中能夠看出,咱們能夠把從A到E的過程分紅若干個階段,這裏是四個階段。處於每一個階段時,都要選擇走哪條支路——決策,一個階段的決策除了影響該階段的效果以外,還影響到下一階段的初始狀態,從而也就影響到整個過程之後的進程。所以,在進行某一階段的決策時,就不能只從這一階段自己考慮,而應使總體的效果最優。

咱們能夠從最後一個階段開始,由終點向始點方向逐階遞推,尋找各點到終點的最短路徑,當遞推到始點時,即獲得了從始點到終點的全過程最短路。這種由後向前的遞推方法,正是動態規劃的尋優思想。

 下面咱們對這個問題進行求解。把從A到E的全過程分爲四個階段,用k表示階段變量。第一階段,有一個初始狀態A,三條可供選擇的支路,以此類推。咱們用)表示在第k階段由初始狀態到下階段的初始狀態的支路距離。用)表示從第k階段的到終點E的最短距離。

用逆序遞推的方法:

1.階段k = 4

第4階段有兩個初始狀態。若全過程最短路徑通過,則有)= 4 ;若全過程最短路徑通過,則有)= 3 。

2.階段 k = 3

假設全過程最短路徑在第3階段通過點:

若由,則有)+)=  4 + 4 = 8

若由,則有)+)=  6 + 3 = 9

所以,)= min(8,9)= 8 ,即由的最短路徑是,最短距離是8。

相似地,假設全過程最短路徑通過點,則有

)= min{[)+ )],[)+ )]}

         = min (7,8) = 7

即由的最短路徑是由,最短距離是7。

同理可得出:)= min ( 6 , 6 ) = 6

的最短路徑有兩條,其距離都是6。

3.階段 k = 2

相似地,可計算以下:

 =  min( 15 , 14 , 14 ) = 14

 =  min(11, 12 , 12 ) = 11

 =  min(14 , 15 , 13 ) = 13

所以,由的最短路徑有三條,最短距離都是14;由的最短路徑是,距離是11;由的最短路徑有兩條:,距離是13。

4.階段 k = 1

 = min ( 16 , 15 , 16 ) = 15

所以,由的全過程最短路徑是,最短距離是15。

從以上過程能夠看出,每一個階段中,都求出本階段的各個初始狀態到終點E的最短路徑和最短距離,當逆序遞推到過程始點A時,便獲得全過程的最短路徑及其最短距離,同時獲得一族最優結果(即各階段的各狀態到終點E的最優結果)。和窮舉法相比,逆敘遞推方法大大減小了計算量,且大大豐富了計算結果。

此題也能夠用順序遞推的方法求解,解法過程類似,在此就不贅述了。

 

例:求子數組之和的最大值

一個有N個元素的一維數組(a[0], a[1]….a[n-1]),咱們定義連續的a[i] ~ a[j],0<= i, j <=n-1爲子數組。

顯然這個數組中包含不少子數組,請求最大的子數組之和。

若是不想時間複雜度,用遍歷全部可能子數組,而後找出最大值就能夠了。

如今若是要求時間複雜度最小,那麼確定是要DP解的。

咱們假設定義兩個數組:

all[i]:表示從i~n-1,最大的子數組之和。

start[i]:表示包含i,而且從i~n-1,最大子數組之和。

all[i]中max只有三種可能:

(1) a[i]單獨就是最大,以後再加一個就會變小。
(2)a[i]+…a[j]最大,即start[i]最大
(3)a[x]+..a[j]最大,即不包含i的後序某一個子數組和最大。

最終,最大的子數組之和是all[0]。根據上述3個可能,很容易寫出以下遞推式:

start[i] = max (a[i], a[i]+start[i+1])
all[i] = max(start[i], all[i+1])

注意咱們把上面max(a, b, c)拆成了兩個max(a, b)

因爲咱們在計算start[i]/all[i]時候須要start[i+?]的值,因此咱們從後向前遞推dp。

代碼以下,時間複雜度O(n):

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
 
int max(int a, int b)
{
    if(a>b)
    {
        return a;
    }else
    {
        return b;
    }
}
 
int max_sum(int* arr, int n)
{
    // Helper array
    int i;
    int* start = (int*)malloc(sizeof(int)*n);
    int* all = (int*)malloc(sizeof(int)*n);
    int final;
    if(!start || !all)
    {
        return -1;
    }
    memset(start, 0, sizeof(int)*n);
    memset(all, 0, sizeof(int)*n);
    // dp
    start[n-1] = arr[n-1];
    all[n-1] = arr[n-1];
    for(i=n-2;i>=0;i--)
    {
        start[i] = max(arr[i], arr[i]+start[i+1]);
        all[i] = max(start[i], all[i+1]);
    }
    final = all[0];
    // Free helper array
    free(start);
    free(all);
    return final;
}
 
int main()
{
    //int arr[6] = {1, -2, 3, 5, -3, 2}; // 8
    int arr[6] = {0, -2, 3, 5, -1, 2}; // 9
    //int arr[5] = {-9, -2, -3, -5, -3}; // -2
    printf("max sum of sub_arr: %d \n", max_sum(arr, sizeof(arr)/sizeof(int)));
    return 0;
}

 

 

 

來源:http://blog.csdn.net/cangchen/article/details/45044811

相關文章
相關標籤/搜索