動態規劃詳解_2

時間 2019-11-13

標籤動態規劃詳解简体版

原文原文鏈接

詳解動態規劃——鄒博講動態規劃

7號晚聽了鄒博一次微課，正好是本身最近正在死磕的動態規劃，因此搬好小板凳聽鄒博講解動態規劃。現將內容整理以下：html

內容主要分爲兩個部分：算法

1. 動態規劃和貪心的認識——工具：馬爾科夫過程數組

2. 動態規劃，經過3個DP中的經典問題詳細講解dom

　　1）最長遞增子序列LISide

　　2）格子取數/走棋盤問題及應用工具

　　3）找零錢/揹包問題post

正題開始。首先，人們認識事物的方法有三種：經過概念（即對事物的基本認識）、經過判斷（即對事物的加深認識）、和推理（對事物的深層認識）。其中，推理又包含概括法和演繹法。（這些從初中高中一直到大學咱們都是一直在學習的，關鍵是理解）學習

概括法是從特殊到通常，屬於發散思惟；（如：蘇格拉底會死；張三會死；李四會死；王五會死……，他們都是人。因此，人都會死。）優化

演繹法是從通常到特殊，屬於匯聚思惟。（如：人都會死的；蘇格拉底是人。因此，蘇格拉底會死。）url

那麼，如何用概括法解決數學問題，進行應用呢？

已知問題規模爲n的前提A，求解一個未知解B。（咱們用An表示「問題規模爲n的已知條件」）

此時，若是把問題規模降到0，即已知A0，能夠獲得A0->B.

若是從A0添加一個元素，獲得A1的變化過程。即A0->A1; 進而有A1->A2; A2->A3; …… ; Ai->Ai+1. 這就是嚴格的概括推理，也就是咱們常用的數學概括法；
對於Ai+1，只須要它的上一個狀態Ai便可完成整個推理過程（而不須要更前序的狀態）。咱們將這一模型稱爲馬爾科夫模型。對應的推理過程叫作「貪心法」。

然而，Ai與Ai+1每每不是互爲充要條件，隨着i的增長，有價值的前提信息愈來愈少，咱們沒法僅僅經過上一個狀態獲得下一個狀態，所以能夠採用以下方案：

{A1->A2}; {A1, A2->A3}; {A1,A2,A3->A4};……; {A1,A2,...,Ai}->Ai+1. 這種方式就是第二數學概括法。
對於Ai+1須要前面的全部前序狀態才能完成推理過程。咱們將這一模型稱爲高階馬爾科夫模型。對應的推理過程叫作「動態規劃法」。

上述兩種狀態轉移圖以下圖所示：

下面經過分析幾個經典問題來理解動態規劃。

實例一：最長遞增子序列（Longest Increasing Subsequence）。

問題描述。給定長度爲N的數組A，計算A的最長單調遞增的子序列（不必定連續）。如給定數組A{5，6，7，1，2，8}，則A的LIS爲{5，6，7，8}，長度爲4.

思路：由於子序列要求是遞增的，因此重點是子序列的起始字符和結尾字符，所以咱們能夠利用結尾字符。想到：以A[0]結尾的最長遞增子序列有多長？以A[1]結尾的最長遞增子序列有多長？……以A[n-1]結尾的最長遞增子序列有多長？分析以下圖所示：

（動態規劃solution）因此咱們可使用一個額外的空間來保存前面已經算得的最長遞增子序列，而後每次更新當前的便可。也就是問題演化成：已經計算獲得了b[0,1,2,……,i-1]，如何計算獲得b[i]呢？

顯然，若是ai>=aj，則能夠將ai放到b[j]的後面，獲得比b[j]更長的子序列。從而：b[i] = max{b[j]}+1. s.t. A[i] > A[j] && 0 <= j < i.

因此計算b[i]的過程是，遍歷b[i]以前的全部位置j，找出知足關係式的最大的b[j].

獲得b[0...n-1]以後，遍歷全部的b[i]找到最大值，即爲最大遞增子序列。總的時間複雜度爲O(N2).

我實現的Java版代碼爲：

publi int LIS(int[] A) {
        if(A == null || A.length == 0)
            return 0;
        int[] b = new int[A.length];
        b[0] = 1;
        int result = 1;
        for(int i=1; i<A.length; i++) {
            int max = -1;
            for(int j=0; j<i; j++) {
                if(A[j] < A[i] && b[j] > max)
                    max = b[j];
            }
            b[i] = max + 1;
            result = Math.max(result, b[i]);
        }
        return result;
    }

進而，若是不只是求LIS的長度，而要求LIS自己呢？咱們能夠經過記錄前驅的方式，從該位置找到其前驅，進而找到前驅的前驅……

Java代碼以下：

View Code

使用動態規劃方法的到O(N2)的時間複雜度算法，可否有更優的方法呢？

（貪心算法solution）咱們仍然使用上面的例子，用其餘的思路試試。咱們遞增式的選擇元素，讓每一次的選擇儘量的小，實際操做以下：

最開始，緩衝區裏爲空；

看到了字符「1」，添加到緩衝區的最後，即緩衝區中是「1」；

看到了字符「4」，「4」比緩衝區的全部字符都大，所以將「4」添加到緩衝區的最後，獲得「14」；

看到了字符「6」，「6」比緩衝區的全部字符都大，所以將「6」添加到緩衝區的最後，獲得「146」；

看到了字符「2」，「2」比「1」大，比「4」小，所以將「4」直接替換成「2」，獲得「126」；

看到了字符「8」，「8」比緩衝區的全部字符都大，所以將「8」添加到緩衝區的最後，獲得「1268」；

看到了字符「9」，「9」比緩衝區的全部字符都大，所以將「9」添加到緩衝區的最後，獲得「12689」；

看到了字符「7」，「7」比「6」大，比「8」小，所以將「8」直接替換成「7」，獲得「12679」；

如今，緩衝區的字符數目爲5，所以，數組A的LIS的長度就是5！

這樣，時間複雜度變爲每次都在一個遞增的序列中替換或插入一個新的元素，因此爲O(nlogn)。

代碼爲：

View Code

但後來我分析了這種方法只能獲得長度，不能獲得子序列自己。（老師上課時提示說考慮序列長度變化的時候，對於示例數組{1，4，6，2，8，9，7}來講能夠解決，即當序列變長的時候，元素1，4，6，8，9正好是最終的字長遞增子序列；當若是原數組是{10，9，2，5，3，7，101，18}時，就不是這麼回事了。目前我沒有找到求解子序列自己的方法，留做之後思考。）

實例二：格子取數/走棋盤問題

問題描述。給定一個m*n的矩陣，每一個位置是一個非負整數，從左上角開始放一個機器人，它每次只能朝右和下走，走到右下角，求機器人的全部路徑中，總和最小的那條路徑。以下圖所示，其中圖中所示的彩色方塊是已知的某些非負整數值。

考慮通常狀況下位於機器人位於某點(x, y)處，那麼它是怎麼來的呢？只可能來自於左邊或者上邊。即：

dp[x, y] = min(dp[x-1, y], dp[x, y-1]) + a[x, y],其中a[x, y]是棋盤中(x, y)點的權重取值。

而後考慮位於最左邊一列與左上邊的一行，獲得全部的狀態轉移方程爲：

因此，代碼以下：

View Code

觀察狀態轉移方程發現，每次更新(x, y)，只須要最多知道上一行便可，不必知道更早的數據。凡是知足這樣條件的動態規劃問題，均可以用「滾動數組」的方式作空間上的優化。

使用滾動數組的狀態轉移方程如上圖所示。

代碼以下：

View Code

實例三：找零錢問題/0-1揹包問題

問題描述。給定某不超過100萬元的現金總額，兌換成數量不限的100、50、20、十、五、二、1元的紙幣組合，共有多少種組合？

思路：此問題涉及兩個類別：面值和總額。因此咱們定義dp[i][j]表示使用小於等於i的紙幣，湊成j元錢，共有多少種組合方法。好比dp[100][500]表示使用面值不大於100的紙幣，湊出500塊錢，共有多少種組合方法。

進一步思考，若是面值都是1元的，則不管總額多少，可行的組合數都爲1.好比只用1元的紙幣湊出100元，顯然只有一種組合方法。那麼若是多出一種面值呢？組合數有什麼變化？

回到dp[100][500]，既然用小於等於100的紙幣湊出500塊錢，則組合中只會要麼包含至少一張100塊的紙幣，要麼不包含100塊的紙幣。因此咱們能夠分紅兩種狀況考慮：

1）若是沒有包括100元，則用到的最大面值可能爲50元，即便用面值小於等於50的紙幣，湊出500塊錢，表示形式爲：dp[50][500];

2）若是必須包含100元，怎麼計算呢？既然至少包含100元，咱們先拿出100塊錢，則還須要湊出400塊錢便可完成。用小於或等於100元的紙幣湊出400塊錢，表示形式爲dp[100][400];

將二者綜合起來爲：dp[100][500] = dp[50][500] + dp[100][400];

爲了方便表示，咱們定義紙幣面值爲一個數組：dom[] = {1,2,5,10,20,50,100},這樣dom[i]和dom[i-1]就表示相鄰的紙幣面額了。i的意義從面值變成了面值下標。

根據上面分析，對於通常狀況，咱們有dp[i][j] = dp[i-1][j] + dp[i][j-dom[i]]. ]有了通常狀況，在考慮兩種特殊狀況：

若是dp[i][0]應該返回啥？dp[i][0]表示用小於等於i的紙幣，湊出0塊錢，咱們能夠定義這種狀況的值爲1；

若是dp[0][j]應該返回啥？dp[0][j]表示用小於等於0的紙幣，湊出j塊錢，咱們能夠定義這種狀況的值爲1.

再看dp[100][78]，用小於等於100元的紙幣湊出78塊錢，這時組合中必定不會包含100塊的紙幣，所以dp[100][78] = dp[50][78],即當j < dom[i]時，dp[i][j] = dp[i-1][j]。

這樣整個dp的過程就出來了：

代碼爲：

View Code

總結，何時適合用動態規劃呢？

總之，動態規劃只是一種解決問題的思路，要靈活運用這種方法，多作練習，就能很快找到靈感了。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。