洛谷P3975 弦論

題意:求一個串的字典序第k小的子串/本質不一樣第k小的子串。ide

解:一開始個人想法是在後綴樹上找,可是不知道後綴樹上的邊對應的是哪些字符...spa

然而能夠不用fail樹轉移,用轉移邊轉移便可。code

先建一個後綴自動機,記憶化搜索每一個節點向後向後有多少個串。blog

而後從起點開始向後一個字符一個字符的肯定。string

注意每到一個新點就要判斷是否結束,並把k減去在此結束的串的個數。it

  1 #include <cstdio>
  2 #include <cstring>
  3 
  4 const int N = 1000010;
  5 
  6 int tr[N][26], len[N], fail[N], siz[N], bin[N], cnt[N], topo[N];
  7 int top, last;
  8 
  9 inline void init() {
 10     top = last = 1;
 11     return;
 12 }
 13 
 14 inline void insert(char c) {
 15     int f = c - 'a';
 16     int p = last, np = ++top;
 17     last = np;
 18     len[np] = len[p] + 1;
 19     cnt[np] = 1;
 20     while(p && !tr[p][f]) {
 21         tr[p][f] = np;
 22         p = fail[p];
 23     }
 24     if(!p) {
 25         fail[np] = 1;
 26     }
 27     else {
 28         int Q = tr[p][f];
 29         if(len[Q] == len[p] + 1) {
 30             fail[np] = Q;
 31         }
 32         else {
 33             int nQ = ++top;
 34             len[nQ] = len[p] + 1;
 35             fail[nQ] = fail[Q];
 36             fail[Q] = fail[np] = nQ;
 37             memcpy(tr[nQ], tr[Q], sizeof(tr[Q]));
 38             while(tr[p][f] == Q) {
 39                 tr[p][f] = nQ;
 40                 p = fail[p];
 41             }
 42         }
 43     }
 44     return;
 45 }
 46 
 47 inline void sort() {
 48     for(int i = 1; i <= top; i++) {
 49         bin[len[i]]++;
 50     }
 51     for(int i = 1; i <= top; i++) {
 52         bin[i] += bin[i - 1];
 53     }
 54     for(int i = 1; i <= top; i++) {
 55         topo[bin[len[i]]--] = i;
 56     }
 57     return;
 58 }
 59 
 60 inline void count() {
 61     for(int i = top; i >= 1; i--) {
 62         int x = topo[i];
 63         cnt[fail[x]] += cnt[x];
 64     }
 65     return;
 66 }
 67 
 68 char s[N];
 69 
 70 int DFS(int x) {
 71     if(siz[x]) {
 72         return siz[x];
 73     }
 74     siz[x] = cnt[x];
 75     for(int i = 0; i < 26; i++) {
 76         if(tr[x][i]) {
 77             siz[x] += DFS(tr[x][i]);
 78         }
 79     }
 80     return siz[x];
 81 }
 82 
 83 int main() {
 84     scanf("%s", s + 1);
 85     int n = strlen(s + 1);
 86     init();
 87     for(int i = 1; i <= n; i++) {
 88         insert(s[i]);
 89     }
 90     sort();
 91     int flag, k;
 92     scanf("%d%d", &flag, &k);
 93     if(flag) {
 94         count();
 95     }
 96     else {
 97         for(int i = 2; i <= top; i++) {
 98             cnt[i] = 1;
 99         }
100     }
101 
102     int sum = 0;
103     for(int i = 2; i <= top; i++) {
104         sum += cnt[i] * (len[i] - len[fail[i]]);
105     }
106 
107     int p = 1;
108     DFS(p);
109     if(k > sum) {
110         puts("-1");
111         return 0;
112     }
113     cnt[1] = 0;
114     while(1) {
115         //printf("k = %d   %d \n", k, k == 1);
116         if(k == 1) {
117             break;
118         }
119         else {
120             k -= cnt[p];
121         }
122         //printf("k = %d p = %d \n", k, p);
123         for(int i = 0; i < 26; i++) {
124             if(!tr[p][i]) {
125                 continue;
126             }
127             if(siz[tr[p][i]] >= k) {
128                 putchar(i + 'a');
129                 p = tr[p][i];
130                 break;
131             }
132             else {
133                 k -= siz[tr[p][i]];
134             }
135         }
136     }
137 
138     return 0;
139 }
AC代碼

 又思考了一下,雖然記憶化搜索會搜到重複的節點,可是這些重複所表示的是到達它的不一樣方案,也就是它表明的不一樣子串。因此須要重複統計。io

這樣一個節點的一條轉移邊其實就是它下一個字符拼上f以後能造成的子串數。event

感受好神奇...ast

相關文章
相關標籤/搜索