精讀《算法 - 動態規劃》

時間 2021-06-10

標籤前端 git github 面試算法 typescript 數組緩存微信函數欄目 Git 简体版

原文原文鏈接

不少人以爲動態規劃很難，甚至認爲面試出動態規劃題目是在爲難候選人，這可能產生一個錯誤潛意識：認爲動態規劃不須要掌握。前端

其實動態規劃很是有必要掌握：git

很是鍛鍊思惟。動態規劃是很是鍛鍊腦力的題目，雖然有套路，但每道題解法思路差別很大，做爲思惟練習很是合適。
很是實用。動態規劃聽起來很高級，但實際上思路和解決的問題都很常見。

動態規劃用來解決必定條件下的最優解，好比：github

自動尋路哪一種走法最優？
揹包裝哪些物品空間利用率最大？
怎麼用最少的硬幣湊零錢？

其實這些問題乍一看都挺難的，畢竟都不是一眼能看出答案的問題。但獲得最優解又很是重要，誰能忍受遊戲中尋路算法繞路呢？誰不但願揹包放的東西更多呢？因此咱們必定要學好動態規劃。面試

精讀

動態規劃不是魔法，它也是經過暴力方法嘗試答案，只是方式更加「聰明」，使得實際上時間複雜度並不高。算法

動態規劃與暴力、回溯算法的區別

上面這句話也說明了，全部動態規劃問題都能經過暴力方法解決！是的，全部最優解問題均可以經過暴力方法嘗試（以及回溯算法），最終找出最優的那個。typescript

暴力算法幾乎能夠解決一切問題。回溯算法的特色是，經過暴力嘗試不一樣分支，最終選擇結果最優的線路。數組

而動態規劃也有分支概念，但不用把每條分支嘗試到終點，而是在走到分叉路口時，能夠直接根據前面各分支的表現，直接推導出下一步的最優解！然而不管是直接推導，仍是前面各分支判斷，都是有條件的。動態規劃可解問題需同時知足如下三個特色：緩存

存在最優子結構。
存在重複子問題。
無後效性。

存在最優子結構

即子問題的最優解能夠推導出全局最優解。微信

什麼是子問題？好比尋路算法中，走完前幾步就是相對於走徹底程的子問題，必須保證走徹底程的最短路徑能夠經過走完前幾步推導出來，才能夠用動態規劃。函數

不要小看這第一條，動態規劃就難在這裏，你到底如何將最優子結構與全局最優解創建上關係？

對於爬樓梯問題，因爲每層臺階都是由前面臺階爬上來的，所以必然存在一個線性關係推導。
若是變成二維平面尋路呢？那麼就升級爲二維問題，存在兩個變量 i,j 與上一步之間關係了。
若是是揹包問題，同時存在物品數量 i、物品重量 j 和物品質量 k 三個變量呢？那就升級爲三位問題，須要尋找三個之間的關係。

依此類推，複雜度能夠上升到 N 維，維度越高思考的複雜度就越高，空間複雜度就越須要優化。

存在重複子問題

即同一個子問題在不一樣場景下存在重複計算。

好比尋路算法中，一樣兩條路線的計算中，有一段路線是公共的，是計算的必經之路，那麼只算一次就行了，當計算下一條路時，遇到這個子路，直接拿第一次計算的緩存便可。典型例子是斐波那契數列，對於 f(3) 與 f(4)，都要計算 f(1) 與 f(2)，由於 f(3) = f(2) + f(1)，而 f(4) = f(3) + f(2) = f(2) + f(1) + f(2)。

這個是動態規劃與暴力解法的關鍵區別，動態規劃之因此性能高，是由於 不會對重複子問題進行重複計算，算法上通常經過緩存計算結果或者自底向上迭代的方式解決，但核心是這個場景要存在重複子問題。

當你以爲暴力解法可能很傻，存在大量重複計算時，就要想一想是哪裏存在重複子問題，是否能夠用動態規劃解決了。

無後效性

即前面的選擇不會影響後面的遊戲規則。

尋路算法中，不會由於前面走了 B 路線而對後面路線產生影響。斐波那契數列由於第 N 項與前面的項是肯定關聯，沒有選擇一說，因此也不存在後效性問題。

什麼場景存在後效性呢？好比你的人生是否能經過動態規劃求最優解？實際上是不行的，由於你今天的選擇可能影響將來人生軌跡，好比你選擇了計算機這個職業，會直接影響到工做的領域，接觸到的人，後面的人生路線所以就徹底變了，因此根本沒法與選擇了土木工程的你進行比較，由於人生賽道都變了。

有同窗可能以爲這樣侷限是否是很大？其實否則，無後效性的問題仍然不少，好比揹包放哪件物品、當前走哪條路線、用了哪些零錢，都不會影響整個揹包大小、整張地圖的地形、以及你最重要付款的金額。

解法套路 - 狀態轉移方程

解決動態規劃問題的核心就是寫出狀態轉移方程，所謂狀態轉移，即經過某些以前步驟推導出將來步驟。

狀態轉移方程通常寫爲 dp(i) = 一系列 dp(j) 的計算，其中 j < i。

其中 i 與 dp(i) 的含義很重要，通常 dp(i) 直接表明題目的答案，i 就有技巧了。好比斐波那契數列，dp(i) 表示的答案就是最終結果，i 表示下標，因爲斐波那契數列直接把狀態轉移方程告訴你了 f(x) = f(x-1) + f(x-2)，那麼根本連推導都沒必要了。

對於複雜問題，難在如何定義 i 的含義，以及下一步狀態如何經過以前狀態推導。 這個作多了題目就有體會，若是沒有，那即使再如何解釋也難以說明，因此後面仍是直接看例子吧。

先舉一個最簡單的動態規劃例子 - 爬樓梯來講明問題。

爬樓梯問題

爬樓梯是一道簡單題，題目以下：

假設你正在爬樓梯。須要 n 階你才能到達樓頂。每次你能夠爬 1 或 2 個臺階。你有多少種不一樣的方法能夠爬到樓頂呢？（給定 n 是一個正整數）

首先 dp(i) 就是問題的答案（解法套路，dp(i) 大部分狀況就是答案，這樣解題思路會最簡化），即爬到第 i 階臺階的方法數量，那麼 i 天然就是要爬到第幾階臺階。

咱們首先看是否存在 最優子結構？由於只能往上爬，因此第 i 階臺階有幾種爬方徹底取決於前面有幾種爬方，而一次只能爬 1 或 2 個臺階，因此第 i 階臺階只可能從第 i-1 或 i-2 個臺階爬上來的，因此第 i 個臺階的爬法就是 i-1 與 i-2 總爬法之和。因此顯然有最優子結構，連狀態轉移方程都呼之欲出了。

再看是否存在 存在重複子問題，其實爬樓梯和斐波那契數列相似，最終的狀態轉移方程是同樣的，因此顯然存在重複子問題。固然直觀來看也容易分析出，10 階臺階的爬法包含了八、9 階的爬法，而 9 階臺階爬法包含了 8 階的，因此存在重複子問題。

最後看是否 無後效性？因爲前面選擇一次爬 1 個或 2 個臺階並不會影響總檯階數，也不會影響你下一次能爬的臺階數，因此無後效性。若是你爬了 2 個臺階，由於太累，下次只能爬 1 個臺階，就屬於有後效性了。或者只要你一共爬了 3 次 2 階，就會由於太累而放棄爬樓梯，直接下樓休息，那麼問題提早結束，也屬於有後效性。

因此爬樓梯的狀態轉移方程爲：

dp(i) = dp(i-1) + dp(i-2)
dp(1) = 1
dp(2) = 2

注意，由於一、2 階臺階沒法應用通用狀態轉移方程，因此要特殊枚舉。這種枚舉思路在代碼裏其實就是 遞歸終結條件，也就是做爲函數 dp(i) 不能無限遞歸，當 i 取值爲 1 或 2 時直接返回枚舉結果（對這道題而言）。因此在寫遞歸時，必定要優先寫上遞歸終結條件。

而後咱們考慮，對於第一階臺階，只有一種爬法，這個沒有爭議吧。對於第二階臺階，能夠直接兩步跨上來，也能夠走兩個一步，因此有兩種爬法，也很容易理解，到這裏此題得解。

關於代碼部分，僅這道題寫一下，後面的題目如無特殊緣由就不寫代碼了：

function dp(i: number) {
  switch (i) {
    case 1:
      return 1;
    case 2:
      return 2;
    default:
      return dp(i - 1) + dp(i - 2);
  }
}

return dp(n);

固然這樣寫重複計算了子結構，因此咱們不要每次傻傻的執行 dp(i - 1)（由於這樣計算了超多重複子問題），咱們須要用緩存兜底：

const cache: number[] = [];

function dp(i: number) {
  switch (i) {
    case 1:
      cache[i] = 1;
      break;
    case 2:
      cache[i] = 2;
      break;
    default:
      cache[i] = cache[i - 1] + cache[i - 2];
  }

  return cache[i];
}

// 既然用了緩存，最好子底向上遞歸，這樣前面的緩存才能優先算出來
for (let i = 1; i <= n; i++) {
  dp(i);
}

return cache[n];

固然這只是簡單的一維線性緩存，更高級的緩存模式還有 滾動緩存。咱們觀察發現，這道題緩存空間開銷是 O(n)，但每次緩存只用了上兩次的值，因此計算到 dp(4) 時，cache[1] 就能夠扔掉了，或者說，咱們能夠滾動利用緩存，讓 cache[3] 佔用 cache[1] 的空間，那麼總體空間複雜度能夠下降到 O(1)，具體作法是：

const cache: [number, number] = [];

function dp(i: number) {
  switch (i) {
    case 1:
      cache[i % 2] = 1;
      break;
    case 2:
      cache[i % 2] = 2;
      break;
    default:
      cache[i % 2] = cache[(i - 1) % 2] + cache[(i - 2) % 2];
  }

  return cache[i % 2];
}

for (let i = 1; i <= n; i++) {
  dp(i);
}

return cache[n % 2];

經過取餘，巧妙的讓緩存永遠交替佔用 cache[0] 與 cache[1]，達到空間利用最大化。固然，這道題由於狀態轉移方程是連續用了前兩個，因此能夠這麼優化，若是遇到用到以前全部緩存的狀態轉移方程，就沒法使用滾動緩存方案了。然而還有更高級的多維緩存，這個後面提到的時候再說。

接下來看一個進階題目，最大子序和。

最大子序和

最大子序和是一道簡單題，題目以下：

給定一個整數數組 nums ，找到一個具備最大和的連續子數組（子數組最少包含一個元素），返回其最大和。

首先按照爬樓梯的套路，dp(i) 就表示最大和，因爲整數數組可能存在負數，因此越多數相加，和不必定越大。

接着看 i，對於數組問題，大部分 i 均可以表明以第 i 位結尾的字符串，那麼 dp(i) 就表示以第 i 位結尾的字符串的最大和。

可能你以爲以 i 結尾，就只能是 [0-i] 範圍的值，那麼 [j-i] 範圍的字符串不就被忽略了？其實否則，[j-i] 若是是最大和，也會被包含在 dp(i) 裏，由於咱們狀態轉移方程能夠選擇不連上 dp(i-1)。

如今開始解題：首先題目是最大和的連續子數組，通常連續的都比較簡單，由於對於 dp(i)，要麼和前面連上，要麼和前面斷掉，因此狀態轉移方程爲：

dp(i) = dp(i-1) + nums[i] 若是 dp(i-1) > 0。
dp(i) = nums[i] 若是 dp(i-1) <= 0。

怎麼理解呢？就是第 i 個狀態能夠直接由第 i-1 個狀態推導出來，既然 dp(i) 是指以第 i 個字符串結尾的最大和，那麼 dp(i-1) 就是以第 i-1 個字符串結尾的最大和，並且此時 dp(i-1) 已經算出來了，那麼 dp(i) 怎麼推導就清楚了：

由於字符串是連續的，因此 dp(i) 要麼是 dp(i-1) + nums[i]，要麼就直接是 nums[i]，因此選擇哪一種，取決於前面的 dp(i-1) 是不是正數，由於以 i 結尾必定包含 nums[i]，因此 nums[i] 無論是正仍是負，都必定要帶上。 因此容易得知，dp(i-1) 若是是正數就連起來，不然就不連。

好了，通過這麼詳細的解釋，相信你已經徹底瞭解動態規劃的解題套路，後面的題目解釋方式我就不會這麼囉嗦了！

這道題若是再複雜一點，不連續怎麼辦呢？讓咱們看看最長遞增子序列問題吧。

最長遞增子序列

最長遞增子序列是一道中等題，題目以下：

給你一個整數數組 nums ，找到其中最長嚴格遞增子序列的長度。

子序列是由數組派生而來的序列，刪除（或不刪除）數組中的元素而不改變其他元素的順序。例如，[3,6,2,7] 是數組 [0,3,1,6,2,2,7] 的子序列。

其實以前的精讀《DOM diff 最長上升子序列》有詳細解析過這道題，包括還有更優的貪心解法，不過咱們此次仍是聚焦在動態規劃方法上。

這道題與上一道的區別就是，首先遞增，其次不連續。

按照套路，dp(i) 就表示以第 i 個字符串結尾的最長上升子序列長度，那麼重點是，dp(i) 怎麼經過以前的推導出來呢？

因爲是不連續的，所以不能只看 dp(i-1) 了，由於 nums[i] 項與 dp(j)（其中 0 <= j < i）組合後均可能達到最大長度，所以須要遍歷全部 j，嘗試其中最大長度的組合。

因此狀態轉移方程爲：

dp[i] = max(dp[j]) + 1，其中 0<=j<i 且 num[j]<num[i]。

這道題的出現，預示着較爲複雜的狀態轉移方程的出現，即第 i 項不是簡單由 i-1 推導，而是由以前全部 dp(j) 推導，其中 0<=j<i。

除此以外，還有推導變種，即根據 dp(dp(i)) 推導，即函數裏套函數，這類問題因爲加深了一層思考腦回路，因此相對更難。咱們看一道這樣的題目：最長有效括號。

最長有效括號

最長有效括號是道困難題，題目以下：

給你一個只包含 '(' 和 ')' 的字符串，找出最長有效（格式正確且連續）括號子串的長度。

這道題之因此是困難題，就由於狀態轉移方程存在嵌套思惟。

咱們首先按套路定義 dp(i) 爲答案，即以第 i 下標結尾的字符串中最長有效括號長度。看出來了嗎？通常字符串題目中，i 都是以字符串下標結尾來定義，不多有定義爲開頭或者別的定義行爲。固然非字符串問題就不是這樣了，這個在後面再說。

咱們繼續題目，若是 s[i] 是 (，那麼不可能組成有效括號，由於最右邊必定不閉合，因此考慮 s[i] 爲 ) 的場景。

若是 s[i-1] 爲 (，那麼構成了 ...() 之勢，最後兩個自成合法閉合，因此只要看前面的便可，即 dp(i-2)，因此這種場景的狀態轉移方程爲：

dp(i) = dp(i-2) + 2

若是 s[i-1] 是 ) 呢？構成了 ...)) 的狀態，那麼只有 i-1 是合法閉合的，且這個合法閉合段以前必須是 ( 與第 i 項造成閉合，才構成此時最長有效括號長度，因此這種場景的狀態轉移方程爲：

dp(i) = dp(i-1) + dp(i - dp(i-1) - 2) + 2，你能夠結合下面的圖來理解：

能夠看到，dp(i-1) 就是第二條橫線的長度，而後若是紅色括號匹配的話，長度又 +2，最後別忘了最左邊若是有知足匹配的也要帶上，這就是 dp(i - dp(i-1) - 2)，因此加到一塊兒就是這種場景的括號最大長度。

到這裏，一維動態規劃問題深度基本上探索完了，在進入多維動態規劃問題前，還有一類一維動態規劃問題，屬於表達式不難，也沒有這題這麼複雜的嵌套 DP，可是思惟複雜度極高，你必定不要盯着全流程看，那樣複雜度過高，你須要充分承認 dp(i-x) 已經算出來部分的含義，進行高度抽象的思考。

柵欄塗色

柵欄塗色是一道困難題，題目以下：

有 k 種顏色的塗料和一個包含 n 個柵欄柱的柵欄，每一個柵欄柱能夠用其中一種顏色進行上色。

你須要給全部柵欄柱上色，而且保證其中相鄰的柵欄柱 最多連續兩個 顏色相同。而後，返回全部有效塗色的方案數。

這道題 k 和 n 都很是巨大，常規暴力解法甚至普通 DP 都會超時。選擇 i 的含義也很重要，這裏 i 到底表明用幾種顏色仍是幾個柵欄呢？選擇柵欄會好作一些，由於柵欄是上色的主體。這樣 dp(i) 就表示上色前 i 個柵欄的全部塗色方案。

首先看下遞歸終止條件。因爲最多連續兩個顏色相同，所以 dp(0) 與 dp(1) 分別是 k 與 k*k，由於每一個柵欄隨便刷顏色，自由組合。那麼 dp(2) 有三個柵欄，非法狀況是三個柵欄全同色，因此用全部可能減掉非法便可，非法場景只有 k 中，因此結果是 k*k*k - k。

那麼考慮通常狀況，對於 dp(i) 有幾種塗色方案呢？直接思考狀況太多，咱們把狀況一分爲二，考慮 i 與 i-1 顏色相同與不一樣兩種狀況考慮。

若是 i 與 i-1 顏色相同，那麼爲了合法，i-1 確定不能與 i-2 顏色相同了，不然就三個同色，這樣的話，無論 i-2 是什麼顏色，i-1 與 i 都只能少取一種顏色，少取的顏色就是 i-2 的顏色，所以 [i-1,i] 這個區間有 k-1 中取色方案，前面有 dp(i-2) 種取色方案，相乘就是最終方案數：dp(i-2) * (k-1)。

這背後其實存在動態思惟，即每種場景的 k-1 都是不一樣的顏色組合，只是不管前面 dp(i-2) 是何種組合，後面兩個柵欄必定有 k-1 種取法，雖然顏色組合的色值不一樣，但顏色組合數量是不變的，因此能夠統一計算。理解這一點很是關鍵。

若是 i 與 i-1 顏色不一樣，那麼第 i 項只有 k-1 種取法，同樣也是動態的，由於永遠不能和 i-1 顏色相同。最後乘上 dp(i-1) 的取色方案，就是總方案數：dp(i-1) * (k-1)。

因此最後總方案數就是二者之和，即 dp(i) = dp(i-2) * (k-1) + dp(i-1) * (k-1)。

這道題的不一樣之處在於，變化太多，任何一個柵欄取的顏色都會影響後面柵欄要取的顏色，乍一看以爲是個有後效性的題目，沒法用動態規劃解決。但實際上，雖然有後效性，但若是進行合理的拆解，後面柵欄的總可能性 k-1 是不變的，因此考慮總可能性數量，是無後效性的，所以站在方案總數上進行抽象思考，纔可能破解此題。

接下來介紹多維動態規劃，從二維開始。二維動態規劃就是用兩個變量表示 DP，即 dp(i,j)，通常在二維數組場景出現較多，固然也有一些兩個數組之間的關係，也屬於二維動態規劃，爲了繼續探討字符串問題，我選擇了字符串問題的二維動態規劃範例，編輯距離這道題來講明。

編輯距離

編輯距離是一道困難題，題目以下：

給你兩個單詞 word1 和 word2，請你計算出將 word1 轉換成 word2 所使用的最少操做數。

你能夠對一個單詞進行以下三種操做：

插入一個字符

刪除一個字符

替換一個字符

只要是字符串問題，基本上 i 都表示以第 i 項結尾的字符串，但這道題有兩個單詞字符串，爲了考慮任意匹配場景，必須用兩個變量表示，即 i j 分別表示 word1 與 word2 結尾下標時，最少操做次數。

那麼對於 dp(i,j) 考慮 word1[i] 與 word2[j] 是否相同，最後經過雙重遞歸，先遞歸 i，在遞歸內再遞歸 j，答案就出來了。

假設最後一個字符相同，即 word1[i] === word2[j] 時，因爲最後一個字符不用改就相同了，因此操做次數就等價於考慮到前一個字符，即 dp(i,j) = dp(i-1,j-1)

假設最後一個字符不一樣，那麼 最後一步 有三種模式能夠獲得：

假設是替換，即 dp(i,j) = dp(i-1,j-1) + 1，由於替換最後一個字符只要一步，而且和前面字符沒什麼關係，因此前面的最小操做次數直接加過來。
假設是插入，即 word1 插入一個字符變成 word2，那麼只要變換到這一步再 +1 插入操做就好了，變換到這一步因爲插入一個就好了，所以 word1 比 word2 少一個單詞，其它都同樣，要變換到這一步，就要進行 dp(i,j-1) 的變換，所以 dp(i,j) = dp(i,j-1) + 1。。
假設是刪除，即 word1 刪除一個字符變成 word2，同理，要進行 dp(i-1,j) 的變化後多一步刪除，所以 dp(i,j) = dp(i-1,j) + 1。

因爲題目取操做最少次數，因此這三種狀況取最小便可，即 dp(i,j) = min(dp(i-1,j-1), dp(i,j-1), dp(i-1,j)) + 1。

因此同時考慮了最後一個字符是否相同後，合併了的狀態轉移方程就是最終答案。

咱們再考慮終止條件，即 i 或 j 爲 -1 時的狀況，由於狀態轉移方程 i 和 j 不斷減少，確定會減小到 0 或 -1，由於 0 是字符串還有一個字符，相對好比考慮 -1 字符串爲空時方便，所以咱們考慮 -1 時做爲邊界條件。

當 i 爲 -1 時，即 word1 爲空，此時要變換爲 word2 很顯然，只有插入 j 次是最小操做次數，所以此時 dp(i,j) = j；同理，當 j 爲 -1 時，即 word2 爲空，此時要刪除 i 次，所以操做次數爲 i，因此 dp(i,j) = i。

非字符串問題

說到這，相信你在字符串動規問題上已經如魚得水了，咱們再看看非字符串場景的動規問題。非字符串場景的動規比較經典的有三個，第一是矩形路徑最小距離，或者最大收益；第二是揹包問題以及變種；第三是打家劫舍問題。

這些問題解決方式都同樣，只是對於 dp(i) 的定義略有區別，好比對於矩形問題來講，dp(i,j) 表示走到 i,j 格子時的最小路徑；對於揹包問題，dp(i,j) 表示裝了第 i 個物品時，揹包還剩 j 空間時最大價格；對於打家劫舍問題，dp(i) 表示打劫到第 i 個房間時最大收益。

由於篇幅問題這裏就不一詳細介紹了，只簡單說明一下矩形問題於打家劫舍問題。

對於矩形問題，狀態轉移方程重點看上個狀態是如何轉移過來的，通常矩形只能向右或者向下移動，路途可能有一些障礙物不能走，咱們要作分支判斷，而後選擇一條符合題目最值要求的路線做爲當前 dp(i) 的轉移方程便可。

對於打家劫舍問題，因爲不能同時打劫相鄰的房屋，因此對於 dp(i)，要麼爲了打劫 i-1 而不打劫第 i 間，或者打劫 i-2 於第 i 間，取這兩種終態的收益最大值便可，即 dp(i) = max(dp(i-1), dp(i-2) + coins[i])。