動態規劃求解最長公共子序列

時間 2019-11-08

標籤動態規劃求解最長公共序列简体版

原文原文鏈接

前言

推出一個新系列，《看圖輕鬆理解數據結構和算法》，主要使用圖片來描述常見的數據結構和算法，輕鬆閱讀並理解掌握。本系列包括各類堆、各類隊列、各類列表、各類樹、各類圖、各類排序等等幾十篇的樣子。mysql

最長公共子序列

最長公共子序列，英文爲Longest Common Subsequence，縮寫LCS。一個序列，若是是某兩個或多個已知序列的最長子序列，則稱爲最長公共子序列。算法

另外，要注意的是最長公共子序列與最長公共子串不同，下面看一個例子就明白。sql

有序列S1和S2，其中S1=hello，S2=hero。那麼最長公共子序列爲heo，而最長公共子串爲he。能夠看到區別就在於一個容許不連續，一個要求必須連續，而共同特色就是都要保持順序性。緩存

暴力窮舉法

暴力窮舉法是最簡單粗暴且直觀的解決方法，既然是暴力了那效率確定是最差。有和兩個序列，窮舉過程首先要枚舉全部可能的子序列，對於序列X，它的子序列數量達到，所以這部分的時間複雜度達到。而每一個子序列去匹配序列Y的時間複雜度爲，因此整個過程的時間複雜度爲。也就是說暴力窮舉法的時間複雜度達到指數級，而實際中序列長度可能較長，這時幾乎沒法使用該方法。網絡

子序列的數量爲什麼是？某個序列的全部子序列能夠當作是從某序列中移除若干個(0到m個)元素後組成的序列，好比ABC，移除0個元素時爲{ABC}，移除1個元素時爲{BC,AC,AB}，移除2個元素時爲{C,B,A}，移除3個元素時爲空。數據結構

暴力窮舉大體步驟：併發

對於序列X，枚舉全部子序列；
對第1步中每一個子序列匹配序列Y，記錄匹配上的最長子序列；

動態規劃

鑑於暴力窮舉法的時間複雜度太大，須要另一種方法解決該問題，動態規劃。通常在能用動態規劃解決的問題須要符合三個特徵：最優子結構、重疊子問題和無後效性。剛恰好，最長公共子序列問題符合動態規劃特徵，下面對該問題具體分析。機器學習

最優子結構

假設有和兩個序列，記X、Y兩個序列對應的最長公共子序列爲，肯定的過程就是一個最優化問題。爲了分析最優子結構，咱們須要從序列X與序列Y的最後一個元素開始。分兩種狀況：數據結構和算法

若是，即序列X與序列Y兩個序列的最後一個元素相同，說明該元素必定是公共子序列的最後一個元素，此時原問題的狀態轉換公式爲 $LCS(X_m,Y_n) =LCS(X_{m-1},Y_{n-1}) +X_m$ 。能夠看到這種狀況下，原問題已經成功分解成子問題，並且每一個階段的最優解均可以經過子問題的最優解獲得，符合最優子結構。學習
若是 $x_m \neq y_n$ ，即序列X與序列Y兩個序列的最後一個元素不相同，此時須要考慮兩種狀況：
1. 假如不是最長公共子序列的最後一個元素，則問題的狀態轉換公式爲 $LCS(X_m,Y_n) =LCS(X_{m-1},Y_{n})$ ，即從 $X_m=<x_1,x_2,…,x_{m-1}>$ 和兩個序列中找。
2. 假如不是最長公共子序列的最後一個元素，則問題的狀態轉換公式爲 $LCS(X_m,Y_n) =LCS(X_{m},Y_{n-1})$ ，即從和 $Y_n=<y_1,y_2,…,y_{n-1}>$ 兩個序列中找。

以上，成功將原問題分解成子問題，並且子問題的最優解最終組成整個問題的最優解，也就是說該問題具有最優子結構性質。

重疊子問題

通過以上分析，咱們將原問題分解成三個子問題：

$LCS(X_m,Y_n) =LCS(X_{m-1},Y_{n-1}) +X_m$
$LCS(X_m,Y_n) =LCS(X_{m-1},Y_{n})$
$LCS(X_m,Y_n) =LCS(X_{m},Y_{n-1})$

從中能夠看出來子問題是存在重疊的，好比對於 $LCS(X_{m-1},Y_{n})$ ，當序列 $X_{m-1}$ 與序列 $Y_{n}$ 的最後一個元素不相同時，子問題會繼續分解成 $LCS(X_{m-2},Y_{n-1})$ 和 $LCS(X_{m-1},Y_{n-1})$ ，也就與前面的子問題 $LCS(X_m,Y_n) =LCS(X_{m-1},Y_{n-1}) +X_m$ 中的 $LCS(X_{m-1},Y_{n-1})$ 重疊了。

因此，原問題具有重疊子問題性質。