最長公共子序列

動態規劃法

常常會遇到複雜問題不能簡單地分解成幾個子問題,而會分解出一系列的子問題。簡單地採用把大問題分解成子問題,並綜合子問題的解導出大問題的解的方法,問題求解耗時會按問題規模呈冪級數增長。html

爲了節約重複求相同子問題的時間,引入一個數組,無論它們是否對最終解有用,把全部子問題的解存於該數組中,這就是動態規劃法所採用的基本方法。算法

動態規劃的一個重要性質特色就是解決「子問題重疊」的場景,能夠有效的避免重複計算數組

問題: 求兩字符序列的最長公共字符子序列

問題描述:字符序列的子序列是指從給定字符序列中隨意地(不必定連續)去掉若干個字符(可能一個也不去掉)後所造成的字符序列。令給定的字符序列X=「x0,x1,…,xm-1」,序列Y=「y0,y1,…,yk-1」是X的子序列,存在X的一個嚴格遞增下標序列<i0,i1,…,ik-1>,使得對全部的j=0,1,…,k-1,有xij=yj。例如,X=「ABCBDAB」,Y=「BCDB」是X的一個子序列。優化

解決方案:

  • 枚舉法.net

    這種方法是最簡單,也是最容易想到的,固然時間複雜度也是龜速的,咱們能夠分析一下,剛纔也說過了cnblogs的子序列code

    個數有27個 ,延伸一下:一個長度爲N的字符串,其子序列有2N個,每一個子序列要在第二個長度爲N的字符串中去匹配,匹配一次htm

    須要O(N)的時間,總共也就是O(N*2N),能夠看出,時間複雜度爲指數級,恐怖的使人窒息。blog

  • 動態規劃遞歸

    考慮最長公共子序列問題如何分解成子問題,設字符串

    A=「a0,a1,…,a<sub>m-1</sub>」,

    B=「b0,b1,…,b<sub>m-1</sub>」,

    並 Z=「z0,z1,…,z<sub>k-1</sub>」 爲它們的最長公共子序列。

    不難證實有如下性質:

    (1) 若是a<sub>m-1</sub>=b<sub>n-1</sub>,則z<sub>k-1</sub>=a<sub>m-1</sub>=b<sub>n-1</sub>,且「z0,z1,…,z<sub>k-2</sub>」是「a0,a1,…,a<sub>m-2</sub>」和「b0,b1,…,b<sub>n-2</sub>」的一個最長公共子序列;

    (2) 若是a<sub>m-1</sub>!=b<sub>n-1</sub>,則若z<sub>k-1</sub>!=a<sub>m-1</sub>,蘊涵「z0,z1,…,z<sub>k-1</sub>」是「a0,a1,…,a<sub>m-2</sub>」和「b0,b1,…,b<sub>n-1</sub>」的一個最長公共子序列;

    (3) 若是a<sub>m-1</sub>!=b<sub>n-1</sub>,則若z<sub>k-1</sub>!=b<sub>n-1</sub>,蘊涵「z0,z1,…,z<sub>k-1</sub>」是「a0,a1,…,a<sub>m-1</sub>」和「b0,b1,…,b<sub>n-2</sub>」的一個最長公共子序列。

    這樣,在找A和B的公共子序列時,若有 a<sub>m-1</sub>=b<sub>n-1</sub>,則進一步解決一個子問題,找「a0,a1,…,a<sub>m-2</sub>」和「b0,b1,…,b<sub>m-2</sub>」的一個最長公共子序列; 若是a<sub>m-1</sub>!=b<sub>n-1</sub>,則要解決兩個子問題,找出「a0,a1,…,a<sub>m-2</sub>」和「b0,b1,…,b<sub>n-1</sub>」的一個最長公共子序列和找出「a0,a1,…,a<sub>m-1</sub>」和「b0,b1,…,b<sub>n-2</sub>」的一個最長公共子序列,再取二者中較長者做爲A和B的最長公共子序列。

    既然是經典的題目確定是有優化空間的,而且解題方式是有固定流程的,這裏咱們採用的是矩陣實現,也就是二維數組。

    第一步:先計算最長公共子序列的長度。

    第二步:根據長度,而後經過回溯求出最長公共子序列。

    現有兩個序列X={x1,x2,x3,...xi},Y={y1,y2,y3,....,yi},

    設一個C[i,j]: 保存Xi與Yj的LCS的長度。

    根據上面的公式其實能夠發現C[i,j]一直保存着當前(Xi,Yi)的最大子序列長度。

回溯輸出最長公共子序列過程:

長度的問題咱們已經解決了,此次要解決輸出最長子序列的問題,

咱們採用一個標記Flag[i,j],當

①:C[i,j]=C[i-1,j-1]+1 時 標記Flag[i,j]= 0, "left_up"; (左上方箭頭)

②:C[i-1,j]>=C[i,j-1] 時 標記Flag[i,j]=1, "up"; (上箭頭)

③: C[i-1,j]<C[i,j-1] 時 標記Flag[i,j]= -1,"left"; (左箭頭)

算法分析:

因爲每次調用至少向上或向左(或向上向左同時)移動一步,故最多調用(m + n)次就會遇到i = 0或j = 0的狀況,此時開始返回。返回時與遞歸調用時方向相反,步數相同,故算法時間複雜度爲Θ(m + n)。

代碼

這裏的 b[][] 充當了 前文中 Flag[][]的角色

#include <stdio.h>
#include <string.h>
#define MAXLEN 100

void LCSLength(char *x, char *y, int m, int n, int c[][MAXLEN], int b[][MAXLEN])
{
    int i, j;
    
    for(i = 0; i <= m; i++)
        c[i][0] = 0;
    for(j = 1; j <= n; j++)
        c[0][j] = 0;
    for(i = 1; i<= m; i++)
    {
        for(j = 1; j <= n; j++)
        {
            if(x[i-1] == y[j-1])
            {
                c[i][j] = c[i-1][j-1] + 1;
                b[i][j] = 0;
            }
            else if(c[i-1][j] >= c[i][j-1])
            {
                c[i][j] = c[i-1][j];
                b[i][j] = 1;
            }
            else
            {
                c[i][j] = c[i][j-1];
                b[i][j] = -1;
            }
        }
    }
}

void PrintLCS(int b[][MAXLEN], char *x, int i, int j)
{
    if(i == 0 || j == 0)
        return;
    if(b[i][j] == 0)
    {
        PrintLCS(b, x, i-1, j-1);
        printf("%c ", x[i-1]);
    }
    else if(b[i][j] == 1)
        PrintLCS(b, x, i-1, j);
    else
        PrintLCS(b, x, i, j-1);
}

int main(int argc, char **argv)
{
    char x[MAXLEN] = {"ABCBDAB"};
    char y[MAXLEN] = {"BDCABA"};
    int b[MAXLEN][MAXLEN];
    int c[MAXLEN][MAXLEN];
    int m, n;
    
    m = strlen(x);
    n = strlen(y);
    
    LCSLength(x, y, m, n, c, b);
    PrintLCS(b, x, m, n);
    
    return 0;
}

參考 輸入連接說明

輸入連接說明

相關文章
相關標籤/搜索