題意:求一個串的字典序第k小的子串/本質不一樣第k小的子串。ide
解:一開始個人想法是在後綴樹上找,可是不知道後綴樹上的邊對應的是哪些字符...spa
然而能夠不用fail樹轉移,用轉移邊轉移便可。code
先建一個後綴自動機,記憶化搜索每一個節點向後向後有多少個串。blog
而後從起點開始向後一個字符一個字符的肯定。string
注意每到一個新點就要判斷是否結束,並把k減去在此結束的串的個數。it
1 #include <cstdio> 2 #include <cstring> 3 4 const int N = 1000010; 5 6 int tr[N][26], len[N], fail[N], siz[N], bin[N], cnt[N], topo[N]; 7 int top, last; 8 9 inline void init() { 10 top = last = 1; 11 return; 12 } 13 14 inline void insert(char c) { 15 int f = c - 'a'; 16 int p = last, np = ++top; 17 last = np; 18 len[np] = len[p] + 1; 19 cnt[np] = 1; 20 while(p && !tr[p][f]) { 21 tr[p][f] = np; 22 p = fail[p]; 23 } 24 if(!p) { 25 fail[np] = 1; 26 } 27 else { 28 int Q = tr[p][f]; 29 if(len[Q] == len[p] + 1) { 30 fail[np] = Q; 31 } 32 else { 33 int nQ = ++top; 34 len[nQ] = len[p] + 1; 35 fail[nQ] = fail[Q]; 36 fail[Q] = fail[np] = nQ; 37 memcpy(tr[nQ], tr[Q], sizeof(tr[Q])); 38 while(tr[p][f] == Q) { 39 tr[p][f] = nQ; 40 p = fail[p]; 41 } 42 } 43 } 44 return; 45 } 46 47 inline void sort() { 48 for(int i = 1; i <= top; i++) { 49 bin[len[i]]++; 50 } 51 for(int i = 1; i <= top; i++) { 52 bin[i] += bin[i - 1]; 53 } 54 for(int i = 1; i <= top; i++) { 55 topo[bin[len[i]]--] = i; 56 } 57 return; 58 } 59 60 inline void count() { 61 for(int i = top; i >= 1; i--) { 62 int x = topo[i]; 63 cnt[fail[x]] += cnt[x]; 64 } 65 return; 66 } 67 68 char s[N]; 69 70 int DFS(int x) { 71 if(siz[x]) { 72 return siz[x]; 73 } 74 siz[x] = cnt[x]; 75 for(int i = 0; i < 26; i++) { 76 if(tr[x][i]) { 77 siz[x] += DFS(tr[x][i]); 78 } 79 } 80 return siz[x]; 81 } 82 83 int main() { 84 scanf("%s", s + 1); 85 int n = strlen(s + 1); 86 init(); 87 for(int i = 1; i <= n; i++) { 88 insert(s[i]); 89 } 90 sort(); 91 int flag, k; 92 scanf("%d%d", &flag, &k); 93 if(flag) { 94 count(); 95 } 96 else { 97 for(int i = 2; i <= top; i++) { 98 cnt[i] = 1; 99 } 100 } 101 102 int sum = 0; 103 for(int i = 2; i <= top; i++) { 104 sum += cnt[i] * (len[i] - len[fail[i]]); 105 } 106 107 int p = 1; 108 DFS(p); 109 if(k > sum) { 110 puts("-1"); 111 return 0; 112 } 113 cnt[1] = 0; 114 while(1) { 115 //printf("k = %d %d \n", k, k == 1); 116 if(k == 1) { 117 break; 118 } 119 else { 120 k -= cnt[p]; 121 } 122 //printf("k = %d p = %d \n", k, p); 123 for(int i = 0; i < 26; i++) { 124 if(!tr[p][i]) { 125 continue; 126 } 127 if(siz[tr[p][i]] >= k) { 128 putchar(i + 'a'); 129 p = tr[p][i]; 130 break; 131 } 132 else { 133 k -= siz[tr[p][i]]; 134 } 135 } 136 } 137 138 return 0; 139 }
又思考了一下,雖然記憶化搜索會搜到重複的節點,可是這些重複所表示的是到達它的不一樣方案,也就是它表明的不一樣子串。因此須要重複統計。io
這樣一個節點的一條轉移邊其實就是它下一個字符拼上f以後能造成的子串數。event
感受好神奇...ast