題目描述
加里敦大學的生物研究所,發現了決定人喜不喜歡吃藕的基因序列S,有這個序列的鹼基序列就會表現出喜歡吃藕的性狀,可是研究人員發現對鹼基序列S,任意修改其中不超過3個鹼基,依然可以表現出吃藕的性狀。如今研究人員想知道這個基因在DNA鏈S0上的位置。因此你須要統計在一個表現出吃藕性狀的人的DNA序列S0上,有多少個連續子串多是該基因,即有多少個S0的連續子串修改小於等於三個字母可以變成S。ios
輸入輸出格式
輸入格式:數組
第一行有一個數T,表示有幾組數據 每組數據第一行一個長度不超過10^5的鹼基序列S0spa
每組數據第二行一個長度不超過10^5的吃藕基因序列Scode
輸出格式:blog
共T行,第i行表示第i組數據中,在S0中有多少個與S等長的連續子串多是表現吃藕性狀的鹼基序列get
輸入輸出樣例
輸入樣例#1:
1 ATCGCCCTA CTTCA
輸出樣例#1:
2
說明
對於20%的數據,S0,S的長度不超過10^4string
對於20%的數據,S0,S的長度不超過10^5,0<T<=10hash
爲何我用hash作只有40分啊, 到底哪裏錯了啊it
----------------------------------------------------------------------------------io
2018年3月2日22:32:03
更新, 終於AC了啊!!!!!檢查了兩天了....... 其實就是q數組初始化要到seed^100000, 我開小了才seed^10000,末尾少個零真的就是40分和100分的差距啊。。。。細心真的很重要!!!!
1 //2018年2月28日20:29:09 2 #include <iostream> 3 #include <cstdio> 4 #include <cstring> 5 #include <algorithm> 6 using namespace std; 7 8 typedef unsigned long long ull; 9 const int N = 100005; 10 const int seed = 107; 11 12 int T; 13 char a[N], b[N]; 14 ull Hash1[N], Hash2[N]; 15 ull q[N]; 16 int len1, len2; 17 18 ull get(int l, int r, ull *g){ 19 return g[r] - g[l-1] * q[r-l+1]; 20 } 21 22 23 24 int getlcp(int x1, int x2){ 25 int l = 1, r = min(len1-x1+1, len2-x2+1), res = 0; 26 while(l <= r){ 27 int mid = l+r >> 1; 28 if(get(x1, x1+mid-1, Hash1) == get(x2, x2+mid-1, Hash2)) res=mid, l=mid+1; 29 else r = mid-1; 30 } 31 return res; 32 } 33 34 bool check(int x){ 35 int y = 1, tmp; 36 for(int i=1; i<=3; i++){ 37 tmp = getlcp(x, y); 38 x += tmp + 1; y += tmp + 1; 39 if(y > len2) return true; 40 } 41 42 tmp = getlcp(x , y); 43 x += tmp; y += tmp; 44 if(y > len2) return true; 45 else return false; 46 47 } 48 49 int main(){ 50 scanf("%d", &T); 51 q[0] = 1; 52 for(int i=1; i<=100000; i++) 53 q[i] = (ull)q[i-1] * seed; 54 55 while(T--){ 56 scanf("%s", a+1); 57 scanf("%s", b+1); 58 len1 = strlen(a+1); len2 = strlen(b+1); 59 for(int i=1; i<=len1; i++) 60 Hash1[i] = Hash1[i-1]*seed + a[i]-'A'+1; 61 for(int i=1; i<=len2; i++) 62 Hash2[i] = Hash2[i-1]*seed + b[i]-'A'+1; 63 64 int ans = 0; 65 for(int i=1; i+len2-1<=len1; i++){ 66 ans += check(i); 67 } 68 printf("%d\n", ans); 69 } 70 71 return 0; 72 }
值得記念一下