最長公共子序列

時間 2019-11-12

標籤最長公共序列简体版

原文原文鏈接

動態規劃法

常常會遇到複雜問題不能簡單地分解成幾個子問題，而會分解出一系列的子問題。簡單地採用把大問題分解成子問題，並綜合子問題的解導出大問題的解的方法，問題求解耗時會按問題規模呈冪級數增長。html

爲了節約重複求相同子問題的時間，引入一個數組，無論它們是否對最終解有用，把全部子問題的解存於該數組中，這就是動態規劃法所採用的基本方法。算法

動態規劃的一個重要性質特色就是解決「子問題重疊」的場景，能夠有效的避免重複計算數組

問題: 求兩字符序列的最長公共字符子序列

問題描述：字符序列的子序列是指從給定字符序列中隨意地（不必定連續）去掉若干個字符（可能一個也不去掉）後所造成的字符序列。令給定的字符序列X=「x0，x1，…，xm-1」，序列Y=「y0，y1，…，yk-1」是X的子序列，存在X的一個嚴格遞增下標序列<i0，i1，…，ik-1>，使得對全部的j=0，1，…，k-1，有xij=yj。例如，X=「ABCBDAB」，Y=「BCDB」是X的一個子序列。優化

解決方案:

枚舉法.net

這種方法是最簡單，也是最容易想到的，固然時間複雜度也是龜速的，咱們能夠分析一下，剛纔也說過了cnblogs的子序列code

個數有27個，延伸一下：一個長度爲N的字符串，其子序列有2N個，每一個子序列要在第二個長度爲N的字符串中去匹配，匹配一次htm

須要O(N)的時間，總共也就是O(N*2N)，能夠看出，時間複雜度爲指數級，恐怖的使人窒息。blog
動態規劃遞歸

考慮最長公共子序列問題如何分解成子問題，設字符串

A=「a0，a1，…，am-1」，

B=「b0，b1，…，bm-1」，

並 Z=「z0，z1，…，zk-1」爲它們的最長公共子序列。

不難證實有如下性質：

（1）若是am-1=bn-1，則zk-1=am-1=bn-1，且「z0，z1，…，zk-2」是「a0，a1，…，am-2」和「b0，b1，…，bn-2」的一個最長公共子序列；

（2）若是am-1!=bn-1，則若zk-1!=am-1，蘊涵「z0，z1，…，zk-1」是「a0，a1，…，am-2」和「b0，b1，…，bn-1」的一個最長公共子序列；

（3）若是am-1!=bn-1，則若zk-1!=bn-1，蘊涵「z0，z1，…，zk-1」是「a0，a1，…，am-1」和「b0，b1，…，bn-2」的一個最長公共子序列。

這樣，在找A和B的公共子序列時，若有 am-1=bn-1，則進一步解決一個子問題，找「a0，a1，…，am-2」和「b0，b1，…，bm-2」的一個最長公共子序列；若是am-1!=bn-1，則要解決兩個子問題，找出「a0，a1，…，am-2」和「b0，b1，…，bn-1」的一個最長公共子序列和找出「a0，a1，…，am-1」和「b0，b1，…，bn-2」的一個最長公共子序列，再取二者中較長者做爲A和B的最長公共子序列。

既然是經典的題目確定是有優化空間的，而且解題方式是有固定流程的，這裏咱們採用的是矩陣實現，也就是二維數組。

第一步：先計算最長公共子序列的長度。

第二步：根據長度，而後經過回溯求出最長公共子序列。

現有兩個序列X={x1,x2,x3，...xi}，Y={y1,y2,y3，....，yi}，

設一個C[i,j]: 保存Xi與Yj的LCS的長度。

根據上面的公式其實能夠發現C[i,j]一直保存着當前(Xi,Yi)的最大子序列長度。

回溯輸出最長公共子序列過程：

長度的問題咱們已經解決了，此次要解決輸出最長子序列的問題，

咱們採用一個標記Flag[i,j]，當

①：C[i,j]=C[i-1,j-1]+1 時標記Flag[i,j]= 0， "left_up"; （左上方箭頭）

②：C[i-1,j]>=C[i,j-1] 時標記Flag[i,j]=1， "up"; （上箭頭）

③: C[i-1,j]<C[i,j-1] 時標記Flag[i,j]= -1，"left"; （左箭頭）

算法分析：

因爲每次調用至少向上或向左（或向上向左同時）移動一步，故最多調用(m + n)次就會遇到i = 0或j = 0的狀況，此時開始返回。返回時與遞歸調用時方向相反，步數相同，故算法時間複雜度爲Θ(m + n)。

代碼

這裏的 b[][] 充當了前文中 Flag[][]的角色

#include <stdio.h>
#include <string.h>
#define MAXLEN 100

void LCSLength(char *x, char *y, int m, int n, int c[][MAXLEN], int b[][MAXLEN])
{
    int i, j;
    
    for(i = 0; i <= m; i++)
        c[i][0] = 0;
    for(j = 1; j <= n; j++)
        c[0][j] = 0;
    for(i = 1; i<= m; i++)
    {
        for(j = 1; j <= n; j++)
        {
            if(x[i-1] == y[j-1])
            {
                c[i][j] = c[i-1][j-1] + 1;
                b[i][j] = 0;
            }
            else if(c[i-1][j] >= c[i][j-1])
            {
                c[i][j] = c[i-1][j];
                b[i][j] = 1;
            }
            else
            {
                c[i][j] = c[i][j-1];
                b[i][j] = -1;
            }
        }
    }
}

void PrintLCS(int b[][MAXLEN], char *x, int i, int j)
{
    if(i == 0 || j == 0)
        return;
    if(b[i][j] == 0)
    {
        PrintLCS(b, x, i-1, j-1);
        printf("%c ", x[i-1]);
    }
    else if(b[i][j] == 1)
        PrintLCS(b, x, i-1, j);
    else
        PrintLCS(b, x, i, j-1);
}

int main(int argc, char **argv)
{
    char x[MAXLEN] = {"ABCBDAB"};
    char y[MAXLEN] = {"BDCABA"};
    int b[MAXLEN][MAXLEN];
    int c[MAXLEN][MAXLEN];
    int m, n;
    
    m = strlen(x);
    n = strlen(y);
    
    LCSLength(x, y, m, n, c, b);
    PrintLCS(b, x, m, n);
    
    return 0;
}

參考輸入連接說明

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。