動態規劃算法(Dynamic Programming,簡稱 DP)彷佛是一種很高深莫測的算法,你會在一些面試或算法書籍的高級技巧部分看到相關內容,什麼狀態轉移方程,重疊子問題,最優子結構等高大上的詞彙也可能讓你望而卻步。java
並且,當你去看用動態規劃解決某個問題的代碼時,你會以爲這樣解決問題居然如此巧妙,但卻難以理解,你可能驚訝於人家是怎麼想到這種解法的。面試
實際上,動態規劃是一種常見的「算法設計技巧」,並無什麼高深莫測,至於各類高大上的術語,那是嚇唬別人用的,只要你親自體驗幾把,這些名詞的含義其實顯而易見,再簡單不過了。算法
至於爲何最終的解法看起來如此精妙,是由於動態規劃遵循一套固定的流程:遞歸的暴力解法 -> 帶備忘錄的遞歸解法 -> 非遞歸的動態規劃解法。這個過程是層層遞進的解決問題的過程,你若是沒有前面的鋪墊,直接看最終的非遞歸動態規劃解法,固然會以爲牛逼而不可及了。數組
固然,見的多了,思考多了,是能夠一步寫出非遞歸的動態規劃解法的。任何技巧都須要練習,咱們先遵循這個流程走,算法設計也就這些套路,除此以外,真的沒啥高深的。函數
本文會經過兩個個比較簡單的例子:斐波那契和湊零錢問題,揭開動態規劃的神祕面紗,描述上述三個流程。後續還會寫幾篇文章探討如何使用動態規劃技巧解決比較複雜的經典問題。優化
首先,第一個快被舉爛了的例子,斐波那契數列。請讀者不要嫌棄這個例子簡單,由於簡單的例子才能讓你把精力充分集中在算法背後的通用思想和技巧上,而不會被那些隱晦的細節問題搞的莫名其妙。後續,困難的例子有的是。設計
步驟1、暴力的遞歸算法code
int fib(int N) { if (N == 1 || N == 2) return 1; return fib(N - 1) + fib(N - 2); }
這個不用多說了,學校老師講遞歸的時候彷佛都是拿這個舉例。咱們也知道這樣寫代碼雖然簡潔易懂,可是十分低效,低效在哪裏?假設 n = 20,請畫出遞歸樹。blog
PS:但凡遇到須要遞歸的問題,最好都畫出遞歸樹,這對你分析算法的複雜度,尋找算法低效的緣由都有巨大幫助。遞歸
這個遞歸樹怎麼理解?就是說想要計算原問題 f(20),我就得先計算出子問題 f(19) 和 f(18),而後要計算 f(19),我就要先算出子問題 f(18) 和 f(17),以此類推。最後遇到 f(1) 或者 f(2) 的時候,結果已知,就能直接返回結果,遞歸樹再也不向下生長了。
遞歸算法的時間複雜度怎麼計算?子問題個數乘以解決一個子問題須要的時間。
子問題個數,即遞歸樹中節點的總數。顯然二叉樹節點總數爲指數級別,因此子問題個數爲 O(2^n)。
解決一個子問題的時間,在本算法中,沒有循環,只有 f(n - 1) + f(n - 2) 一個加法操做,時間爲 O(1)。
因此,這個算法的時間複雜度爲 O(2^n),指數級別,爆炸。
觀察遞歸樹,很明顯發現了算法低效的緣由:存在大量重複計算,好比 f(18) 被計算了兩次,並且你能夠看到,以 f(18) 爲根的這個遞歸樹體量巨大,多算一遍,會耗費巨大的時間。更況且,還不止 f(18) 這一個節點被重複計算,因此這個算法及其低效。
這就是動態規劃問題的第一個性質:重疊子問題。下面,咱們想辦法解決這個問題。
步驟2、帶備忘錄的遞歸解法
明確了問題,其實就已經把問題解決了一半。即然耗時的緣由是重複計算,那麼咱們能夠造一個「備忘錄」,每次算出某個子問題的答案後別急着返回,先記到「備忘錄」裏再返回;每次遇到一個子問題先去「備忘錄」裏查一查,若是發現以前已經解決過這個問題了,直接把答案拿出來用,不要再耗時去計算了。
通常使用一個數組充當這個「備忘錄」,固然你也可使用哈希表(字典),思想都是同樣的。
int fib(int N) { if (N < 1) return 0; // 備忘錄全初始化爲 0 vector<int> memo(N + 1, 0); // 初始化最簡狀況 memo[1] = memo[2] = 1; return helper(memo, N); } int helper(vector<int>& memo, int n) { // 未被計算過 if (n > 0 && memo[n] == 0) memo[n] = helper(memo, n - 1) + helper(memo, n - 2); return memo[n]; }
如今,畫出遞歸樹,你就知道「備忘錄」到底作了什麼。
實際上,帶「備忘錄」的遞歸算法,把一棵存在巨量冗餘的遞歸樹經過「剪枝」,改形成了一幅不存在冗餘的遞歸圖,極大減小了子問題(即遞歸圖中節點)的個數。
遞歸算法的時間複雜度怎麼算?子問題個數乘以解決一個子問題須要的時間。
子問題個數,即圖中節點的總數,因爲本算法不存在冗餘計算,子問題就是 f(1), f(2), f(3) ... f(20),數量和輸入規模 n = 20 成正比,因此子問題個數爲 O(n)。
解決一個子問題的時間,同上,沒有什麼循環,時間爲 O(1)。
因此,本算法的時間複雜度是 O(n)。比起暴力算法,是降維打擊。
至此,帶備忘錄的遞歸解法的效率已經和動態規劃同樣了。實際上,這種解法和動態規劃的思想已經差很少了,只不過這種方法叫作「自頂向下」,動態規劃叫作「自底向上」。
啥叫「自頂向下」?注意咱們剛纔畫的遞歸樹(或者說圖),是從上向下延伸,都是從一個規模較大的原問題好比說 f(20),向下逐漸分解規模,直到 f(1) 和 f(2) 觸底,而後逐層返回答案,這就叫「自頂向下」。
啥叫「自底向上」?反過來,咱們直接從最底下,最簡單,問題規模最小的 f(1) 和 f(2) 開始往上推,直到推到咱們想要的答案 f(20),這就是動態規劃的思路,這也是爲何動態規劃通常都脫離了遞歸,而是由循環迭代完成計算。
步驟3、動態規劃
有了上一步「備忘錄」的啓發,咱們能夠把這個「備忘錄」獨立出來成爲一張表,就叫作 DP table 吧,在這張表上完成「自底向上」的推算豈不美哉!
int fib(int N) { vector<int> dp(N + 1, 0); dp[1] = dp[2] = 1; for (int i = 3; i <= N; i++) dp[i] = dp[i - 1] + dp[i - 2]; return dp[N]; }
畫個圖就很好理解了,並且你發現這個 DP table 特別像以前那個「剪枝」後的結果,只是反過來算而已。實際上,帶備忘錄的遞歸解法中的「備忘錄」,最終完成後就是這個 DP table,因此說這兩種解法實際上是差很少的,大部分狀況下,效率也基本相同。
這裏,引出「動態轉移方程」這個名詞,實際上就是描述問題結構的數學形式:
爲啥叫「狀態轉移方程」?爲了聽起來高端。你把 f(n) 想作一個狀態 n,這個狀態 n 是由狀態 n - 1 和狀態 n - 2 相加轉移而來,這就叫狀態轉移,僅此而已。
你會發現,上面的幾種解法中的全部操做,例如 return f(n - 1) + f(n - 2),dp[i] = dp[i - 1] + dp[i - 2],以及對備忘錄或 DP table 的初始化操做,都是圍繞這個方程式的不一樣表現形式。可見列出「狀態轉移方程」的重要性,它是解決問題的核心。很容易發現,其實狀態轉移方程直接表明着暴力解法。
千萬不要看不起暴力解,動態規劃問題最困難的就是寫出狀態轉移方程,即這個暴力解。優化方法無非是用備忘錄或者 DP table,再無奧妙可言。
這個例子的最後,講一個細節優化。細心的讀者會發現,根據斐波那契數列的狀態轉移方程,當前狀態只和以前的兩個狀態有關,其實並不須要那麼長的一個 DP table 來存儲全部的狀態,只要想辦法存儲以前的兩個狀態就好了。因此,能夠進一步優化,把空間複雜度降爲 O(1):
int fib(int n) { if (n < 2) return n; int prev = 0, curr = 1; for (int i = 0; i < n - 1; i++) { int sum = prev + curr; prev = curr; curr = sum; } return curr; }
有人會問,動態規劃的另外一個重要特性「最優子結構」,怎麼沒有涉及?下面會涉及。斐波那契數列的例子嚴格來講不算動態規劃,以上旨在演示算法設計螺旋上升的過程。當問題中要求求一個最優解或在代碼中看到循環和 max、min 等函數時,十有八九,須要動態規劃大顯身手。
下面,看第二個例子,湊零錢問題,有了上面的詳細鋪墊,這個問題會很快解決。
題目:給你 k 種面值的硬幣,面值分別爲 c1, c2 ... ck,再給一個總金額 n,問你最少須要幾枚硬幣湊出這個金額,若是不可能湊出,則回答 -1 。
好比說,k = 3,面值分別爲 1,2,5,總金額 n = 11,那麼最少須要 3 枚硬幣,即 11 = 5 + 5 + 1 。下面走流程。
1、暴力解法
首先是最困難的一步,寫出狀態轉移方程,這個問題比較好寫:
其實,這個方程就用到了「最優子結構」性質:原問題的解由子問題的最優解構成。即 f(11) 由 f(10), f(9), f(6) 的最優解轉移而來。
記住,要符合「最優子結構」,子問題間必須互相獨立。啥叫相互獨立?你確定不想看數學證實,我用一個直觀的例子來說解。
好比說,你的原問題是考出最高的總成績,那麼你的子問題就是要把語文考到最高,數學考到最高...... 爲了每門課考到最高,你要把每門課相應的選擇題分數拿到最高,填空題分數拿到最高...... 固然,最終就是你每門課都是滿分,這就是最高的總成績。
獲得了正確的結果:最高的總成績就是總分。由於這個過程符合最優子結構,「每門科目考到最高」這些子問題是互相獨立,互不干擾的。
可是,若是加一個條件:你的語文成績和數學成績會互相制約,此消彼長。這樣的話,顯然你能考到的最高總成績就達不到總分了,按剛纔那個思路就會獲得錯誤的結果。由於子問題並不獨立,語文數學成績沒法同時最優,因此最優子結構被破壞。
回到湊零錢問題,顯然子問題之間沒有相互制約,而是互相獨立的。因此這個狀態轉移方程是能夠獲得正確答案的。
int coinChange(vector<int>& coins, int amount) { if (amount == 0) return 0; int ans = INT_MAX; for (int coin : coins) { // 金額不可達 if (amount - coin < 0) continue; int subProb = coinChange(coins, amount - coin); // 子問題無解 if (subProb == -1) continue; ans = min(ans, subProb + 1); } return ans == INT_MAX ? -1 : ans; }
畫出遞歸樹:
時間複雜度分析:子問題總數 x 每一個子問題的時間。子問題總數爲遞歸樹節點個數,這個比較難看出來,是 O(n^k),總之是指數級別的。每一個子問題中含有一個 for 循環,複雜度爲 O(k)。因此總時間複雜度爲 O(k*n^k),指數級別。
2、帶備忘錄的遞歸算法
int coinChange(vector<int>& coins, int amount) { // 備忘錄初始化爲 -2 vector<int> memo(amount + 1, -2); return helper(coins, amount, memo); } int helper(vector<int>& coins, int amount, vector<int>& memo) { if (amount == 0) return 0; if (memo[amount] != -2) return memo[amount]; int ans = INT_MAX; for (int coin : coins) { // 金額不可達 if (amount - coin < 0) continue; int subProb = helper(coins, amount - coin, memo); // 子問題無解 if (subProb == -1) continue; ans = min(ans, subProb + 1); } // 記錄本輪答案 memo[amount] = (ans == INT_MAX) ? -1 : ans; return memo[amount]; }
不畫圖了,很顯然「備忘錄」大大減少了子問題數目,徹底消除了子問題的冗餘,因此子問題總數不會超過金額數 n,即子問題數目爲 O(n)。處理一個子問題的時間不變,還是 O(k),因此總的時間複雜度是 O(kn)。
3、動態規劃
int coinChange(vector<int>& coins, int amount) { vector<int> dp(amount + 1, INT_MAX); dp[0] = 0; for (int i = 0; i < dp.size(); i++) { // 內層 for 在求全部子問題 + 1 的最小值 for (int coin : coins) { if (i - coin < 0) continue; dp[i] = min(dp[i], 1 + dp[i - coin]); } } return dp[amount] == INT_MAX ? -1 : dp[amount]; }
最後總結
若是你不太瞭解動態規劃,還能看到這裏,真得給你鼓掌,相信你已經掌握了這個算法的設計技巧。
計算機解決問題其實沒有任何奇技淫巧,它惟一的解決辦法就是窮舉,窮舉全部可能性。算法設計無非就是先思考「如何窮舉」,而後再追求「如何聰明地窮舉」。
列出動態轉移方程,就是在解決「如何窮舉」的問題。之因此說它難,一是由於不少窮舉須要遞歸實現,二是由於有的問題自己的解空間複雜,不那麼容易窮舉完整。
備忘錄、DP table 就是在追求「如何聰明地窮舉」。用空間換時間的思路,是下降時間複雜度的不二法門,除此以外,試問,還能玩出啥花活?