給定字符串 \(S\) ,對於 \(S\) 的每一個前綴 \(T\) 求 \(T\) 全部循環同構串的字典序最小的串,輸出其起始下標。(若有多個輸出最靠前的)html
\(|S| \le 3 \times 10^6\)c++
本文參考了官方題解。git
假設咱們如今考慮前綴 \(S[1 \dots k]\) ,咱們考慮哪些起始位置可能成爲答案,咱們稱做候選點。也就是對於這些候選點來講,對於 \(i \ge k\) ,他們永遠都會比非候選點更加優秀。數據結構
咱們首先能夠經過不循環移位比出他們的字典序的話,確定能夠直接看出哪一個必定不是候選點。學習
性質一:假設兩個位置 \(i < j\) 。 若是 \(\mathrm{lcp}(S[i \dots n],S[j \dots n]) \le k − j\) , 那麼 \(i,j\) 之間確定有一個不是候選點.優化
讀者自證不難,利用上這個性質纔是關鍵。spa
咱們假設獲得 \(S[1 \dots k - 1]\) 的候選點集 \(P\) ,對於 \(i, j \in P, i < j\) 那麼必定有 \(\mathrm{lcp}(S[i \dots n], S[j \dots n]) > (k - 1) - j\) ,咱們只須要找出是否存在一個 \(\mathrm{lcp}(S[i \dots n],S[j \dots n]) \le k − j\) 便可排除一個候選點。debug
咱們顯然只須要比較 \(S[i + k - j]\) 與 \(S[k]\) 就能比出來了,可是枚舉全部點對是十分浪費的一件事。咱們只考慮比較距離最遠兩個元素,留下較優的元素便可。code
而後這樣看起來仍是 \(\mathcal O(n^2)\) 的,但彷佛能跑前 \(50pts\) 。(也許有更嚴謹的更優複雜度吧)htm
而後還須要利用一個神奇的性質優化候選點數。
性質二:對於兩個點 \(i < j\) , 假設 \(\mathrm{lcp}(S[i \dots n],S[j \dots n]]) > k − j\) , 若是有 \(k − j \ge j − i\) , 那麼 \(j\) 不是候選點。
這個性質看上去沒有那麼顯然了。
證實:這個性質是有最小循環表示的某個性質得來的, 假設串 \(S = S_1 S_1 S_2\) ,其中 \(S_1, S_2\) 是任意兩個子串。
- 要麼有 \(S_1S_1S_2 \le S_1S_2 S_1 \le S_2S_1S_1\) 。
- 要麼有 \(S_1S_1S_2 \ge S_1S_2 S_1 \ge S_2S_1S_1\) 。
這個討論 \(S_1, S_2\) 字典序大小不難發現。
那麼若是有 \(k - j \ge j - i\) 那麼 \(S[1 \dots k]\) 形如 \(ABBC\) ,那麼咱們把這兩個後綴便可用 \(BBCA\) 和 \(BCAB\) 表示。把 \(S_1\) 設成 \(B\) ,\(S_2\) 設成 \(CA\) ,那麼其實就是 \(S_1S_1S_2\) 與 \(S_1S_2S_1\) ,顯而後者必定會被另外兩個循環串包在中間,必定不如其餘兩個中的一個優。
利用上了這個性質,那麼就有相鄰兩個候選點距離翻倍,那麼只有 \(\mathcal O(\log n)\) 個候選點了。
這樣的話,看似咱們能夠利用各類後綴數據結構在 \(\mathcal O(n \log n)\) 內輕鬆愉悅的解決。
實則否則。。。除非你用 \(\text{SA-IS}\) ,那當我沒說。
咱們預處理那裏的複雜度要儘可能下降,咱們還須要知道一個性質。
性質三:對於任意兩個候選點 \(i < j\) 那麼 \(S[j \dots k]\) 是 \(S[i \dots k]\) 的一個前綴。
這個利用性質一不難發現。
那麼咱們發現咱們每次其實只須要比較一個後綴和原串的字典序大小,這正好契合了 \(\mathrm{ExKmp}\) 的用途。
不會的話能夠看我以前的學習筆記 qwq
而後預處理就變成 \(\mathcal O(n)\) ,總複雜度是 \(\mathcal O(n \log n)\) 。
求區間最小(循環)後綴,均可以考慮候選點只有 \(\mathcal O(\log n)\) 個的神奇性質。
#include <bits/stdc++.h> #define For(i, l, r) for (register int i = (l), i##end = (int)(r); i <= i##end; ++i) #define Fordown(i, r, l) for (register int i = (r), i##end = (int)(l); i >= i##end; --i) #define Rep(i, r) for (register int i = (0), i##end = (int)(r); i < i##end; ++i) #define Set(a, v) memset(a, v, sizeof(a)) #define Cpy(a, b) memcpy(a, b, sizeof(a)) #define debug(x) cout << #x << ": " << (x) << endl using namespace std; template<typename T> inline bool chkmin(T &a, T b) { return b < a ? a = b, 1 : 0; } template<typename T> inline bool chkmax(T &a, T b) { return b > a ? a = b, 1 : 0; } inline int read() { int x(0), sgn(1); char ch(getchar()); for (; !isdigit(ch); ch = getchar()) if (ch == '-') sgn = -1; for (; isdigit(ch); ch = getchar()) x = (x * 10) + (ch ^ 48); return x * sgn; } void File() { #ifdef zjp_shadow freopen ("3103.in", "r", stdin); freopen ("3103.out", "w", stdout); #endif } const int N = 3e6 + 1e3; void Get_Next(char *S, int *next) { int lenS = strlen(S + 1), p = 1, pos; next[1] = lenS; while (p + 1 <= lenS && S[p] == S[p + 1]) ++ p; next[pos = 2] = p - 1; For (i, 3, lenS) { int len = next[i - pos + 1]; if (len + i < p + 1) next[i] = len; else { int j = max(p - i + 1, 0); while (i + j <= lenS && S[j + 1] == S[i + j]) ++ j; p = i + (next[pos = i] = j) - 1; } } } char S[N]; int lcp[N], n; vector<int> cur; inline int cmp(int p, int len) { return lcp[p] >= len ? 0 : (S[lcp[p] + 1] < S[p + lcp[p]] ? 1 : -1); } inline int cmp(int x, int y, int len) { static int res; assert(x > y); if ((res = cmp(y + (len - x + 1), x - y))) return res > 0 ? x : y; if ((res = cmp(x - y + 1, y - 1))) return res > 0 ? y : x; return y; } int main () { File(); scanf ("%s", S + 1); n = strlen(S + 1); Get_Next(S, lcp); For (k, 1, n) { vector<int> tmp(1, k); for (int i : cur) { while (!tmp.empty() && S[i + k - tmp.back()] < S[k]) tmp.pop_back(); if (tmp.empty() || S[i + k - tmp.back()] == S[k]) { while (!tmp.empty() && k - tmp.back() >= tmp.back() - i) tmp.pop_back(); tmp.push_back(i); } } cur = tmp; int ans = cur[0]; For (i, 1, cur.size() - 1) ans = cmp(ans, cur[i], k); printf ("%d%c", ans, k == kend ? '\n' : ' '); } return 0; }