[TJOI2017]DNA

題目描述

加里敦大學的生物研究所,發現了決定人喜不喜歡吃藕的基因序列S,有這個序列的鹼基序列就會表現出喜歡吃藕的性狀,可是研究人員發現對鹼基序列S,任意修改其中不超過3個鹼基,依然可以表現出吃藕的性狀。如今研究人員想知道這個基因在DNA鏈S0上的位置。因此你須要統計在一個表現出吃藕性狀的人的DNA序列S0上,有多少個連續子串多是該基因,即有多少個S0的連續子串修改小於等於三個字母可以變成S。ios

輸入輸出格式

輸入格式:數組

 

第一行有一個數T,表示有幾組數據 每組數據第一行一個長度不超過10^5的鹼基序列S0spa

每組數據第二行一個長度不超過10^5的吃藕基因序列Scode

 

輸出格式:blog

 

共T行,第i行表示第i組數據中,在S0中有多少個與S等長的連續子串多是表現吃藕性狀的鹼基序列get

 

輸入輸出樣例

輸入樣例#1:
1
ATCGCCCTA
CTTCA
輸出樣例#1:
2

說明

對於20%的數據,S0,S的長度不超過10^4string

對於20%的數據,S0,S的長度不超過10^5,0<T<=10hash

 

爲何我用hash作只有40分啊, 到底哪裏錯了啊it

----------------------------------------------------------------------------------io

2018年3月2日22:32:03

更新, 終於AC了啊!!!!!檢查了兩天了....... 其實就是q數組初始化要到seed^100000, 我開小了才seed^10000,末尾少個零真的就是40分和100分的差距啊。。。。細心真的很重要!!!! 

 

 1 //2018年2月28日20:29:09
 2 #include <iostream>
 3 #include <cstdio>
 4 #include <cstring> 
 5 #include <algorithm>
 6 using namespace std;  7 
 8 typedef unsigned long long ull;  9 const int N = 100005; 10 const int seed = 107; 11 
12 int T; 13 char a[N], b[N]; 14 ull Hash1[N], Hash2[N]; 15 ull q[N]; 16 int len1, len2; 17 
18 ull get(int l, int r, ull *g){ 19     return g[r] - g[l-1] * q[r-l+1]; 20 } 21 
22 
23 
24 int getlcp(int x1, int x2){ 25     int l = 1, r = min(len1-x1+1, len2-x2+1), res = 0; 26     while(l <= r){ 27         int mid = l+r >> 1; 28         if(get(x1, x1+mid-1, Hash1) == get(x2, x2+mid-1, Hash2)) res=mid, l=mid+1; 29         else r = mid-1; 30  } 31     return res; 32 } 33 
34 bool check(int x){ 35     int y = 1, tmp; 36     for(int i=1; i<=3; i++){ 37         tmp = getlcp(x, y); 38         x += tmp + 1; y += tmp + 1; 39         if(y > len2) return true; 40  } 41     
42     tmp = getlcp(x , y); 43     x += tmp; y += tmp; 44     if(y > len2) return true; 45     else return false; 46 
47 } 48 
49 int main(){ 50     scanf("%d", &T); 51     q[0] = 1; 52     for(int i=1; i<=100000; i++) 53         q[i] = (ull)q[i-1] * seed; 54     
55     while(T--){ 56         scanf("%s", a+1); 57         scanf("%s", b+1); 58         len1 = strlen(a+1); len2 = strlen(b+1); 59         for(int i=1; i<=len1; i++) 60             Hash1[i] = Hash1[i-1]*seed + a[i]-'A'+1; 61         for(int i=1; i<=len2; i++) 62             Hash2[i] = Hash2[i-1]*seed + b[i]-'A'+1; 63         
64         int ans = 0; 65         for(int i=1; i+len2-1<=len1; i++){ 66             ans += check(i); 67  } 68         printf("%d\n", ans); 69  } 70 
71     return 0; 72 }

 

值得記念一下

相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息