好像又好久沒寫博客了
總結成一個小札仍是香啊 awa
把 @tly 的博客學了一遍而後翻譯成本身看得懂的備忘優化
你可能會在下面看到 BASIC_POLY
這麼一個命名空間,代碼以下。ui
#define con(type) const type & const int N=1<<20,MOD=998244353; inline int add(con(int)a,con(int)b){return a+b>=MOD? a+b-MOD:a+b;} inline int sub(con(int)a,con(int)b){return a-b<0? a-b+MOD:a-b;} inline int mul(con(int)a,con(int)b){return int(1ll*a*b%MOD);} inline int ina_pow(con(int)a,con(int)b){return b?mul(ina_pow(mul(a,a),b>>1),(b&1)?a:1):1;} namespace BASIC_POLY{ int w[N+10],eta_lg[N+10],rev[N+10]; void init(){ w[0]=eta_lg[1]=0;w[1]=ina_pow(3,(MOD-1)>>20); for(int i=2;i<N;i++){ w[i]=mul(w[i-1],w[1]); eta_lg[i]=eta_lg[(i+1)>>1]+1; } } void ntt(int *ary,con(int)n,con(int)typ){ for(int i=1;i<n;i++){ rev[i]=rev[i>>1]>>1|((i&1)*(n>>1)); if(rev[i]<i) swap(ary[i],ary[rev[i]]); } for(int i=1,ii=2;i<n;i<<=1,ii<<=1){ int u=N/ii; for(int j=0;j<n;j+=ii){ int *a=ary+j,*b=ary+j+i,*p=w,q=*b; for(int k=0;k<i;k++,a++,b++,p+=u,q=mul(*b,*p)) *b=sub(*a,q),*a=add(*a,q); } } if(typ==-1){ reverse(ary+1,ary+n); for(int i=0,ivn=MOD-(MOD-1)/n;i<n;i++) ary[i]=mul(ary[i],ivn); } } int modelize(con(int)l){return 1<<eta_lg[l];} void polyInv(int *a,int *b,con(int)n){ if(n==1){b[0]=ina_pow(a[0],MOD-2);return;} int m=(n+1)>>1,l=modelize(2*(m-1)+(n-1)+1); polyInv(a,b,m); static int tmp1[N+10],tmp2[N+10]; for(int i=0;i<n;i++) tmp1[i]=a[i];fill(tmp1+n,tmp1+l,0); for(int i=0;i<m;i++) tmp2[i]=b[i];fill(tmp2+m,tmp2+l,0); ntt(tmp1,l,1),ntt(tmp2,l,1); for(int i=0;i<l;i++) tmp1[i]=mul(tmp2[i],sub(2,mul(tmp1[i],tmp2[i]))); ntt(tmp1,l,-1); for(int i=0;i<n;i++) b[i]=tmp1[i]; } void polyDet(int *a,int *b,con(int)n){ for(int i=1;i<n;i++) b[i-1]=mul(a[i],i); b[n-1]=0; } }
給定一個最高次項爲 \(n-1\) 的多項式 \(f(x)\),求 \(f(a_0),f(a_1)\cdots f(a_{m-1})\)。spa
以前的作法要用到多項式取模這種大常數計算,並且代碼還很複雜……翻譯
先定義一種所謂的「差卷積」,記做code
咱們能夠構造出 \(g(x)=\frac{1}{1-ax}\) 使得 \(h=f\otimes g\) 知足 \([x^0]h(x)=f(a)\)。get
把 $g(x)$ 的閉形式展開,則 $(f\otimes g)$ 至關於博客
$$(f_0+f_1x+f_2x^2+\cdots)\otimes(1+ax+a^2x^2+\cdots)$$觀察其常數項,必定是 $f_ix^i\otimes a^ix^i$,也就是 $\sum a^if_i$。it
這樣咱們能夠把一個點的求值問題轉化成卷積問題。那怎麼擴展到多點求值呢?ast
關於差卷積,咱們還須要一個性質——class
根據定義很容易理解,即 \(f_ig_jh_kx^{i-j-k}=f_ix^i(g_jh_k)x^{-(j+k)}\)。
有了這個性質,就能夠考慮用線段樹的方式分治。咱們但願能在線段樹的第 \(i\) 個葉子處獲得 \([x^0](f\otimes\frac{1}{1-a_ix})\)。那麼線段樹上區間 \([l,r]\) 就維護
要從 \([l,r]\) 遞推到子區間 \([l,m]\),咱們須要計算:
代入便可證實。因而咱們還須要對線段樹的每一個節點 \([l,r]\) 先預處理出
\(T_{l,r}\) 的次數和節點的大小是一致的,由於線段樹上每一層節點大小減半,能夠直接 \(O(n\log n)\) 預處理。
彷佛如今就能夠解決多點求值了?但還剩了一個很是棘手的問題——\(S_{l,r}\) 是一個形式冪級數,咱們應該保留多少項才能計算出葉子處的常數項?
實際上咱們只須要保留 \(S_{l,r}\) 的前 \(r-l+1\) 項,概括證實以下:
這樣的話複雜度就有保證了,每層項數減半,仍然能夠 \(O(n\log n)\) 解決。
//BASIC_POLY 中主要是NTT這些東西 namespace UPPER_POLY{ typedef vector<int> vint; //普通卷積 vint polyMul(con(vint)a,con(vint)b){ static int tmp1[N+10],tmp2[N+10]; int na=(int)a.size(),nb=(int)b.size(),nc=na+nb-1; vint c(nc); int l=BASIC_POLY::modelize(nc); for(int i=0;i<na;i++) tmp1[i]=a[i];fill(tmp1+na,tmp1+l,0); for(int i=0;i<nb;i++) tmp2[i]=b[i];fill(tmp2+nb,tmp2+l,0); BASIC_POLY::ntt(tmp1,l,1),BASIC_POLY::ntt(tmp2,l,1); for(int i=0;i<l;i++) tmp1[i]=mul(tmp1[i],tmp2[i]); BASIC_POLY::ntt(tmp1,l,-1); for(int i=0;i<nc;i++) c[i]=tmp1[i]; return c; } //差卷積,卷積結果保留前 nc項 vint polySubMul(con(vint)a,con(vint)b,con(int)nc){ vint c=a;reverse(c.begin(),c.end()); c=polyMul(c,b); c.resize(a.size()),reverse(c.begin(),c.end()); c.resize(nc); return c; } vint seg[N]; #define idx(l,r) (((l)+(r))|((l)!=(r))) //預處理出 T[l,r] void build(int *a,con(int)le,con(int)ri){ if(le==ri){ seg[idx(le,ri)].clear(); seg[idx(le,ri)].push_back(1); seg[idx(le,ri)].push_back(sub(0,a[le])); return; } int mi=(le+ri)>>1; build(a,le,mi),build(a,mi+1,ri); seg[idx(le,ri)]=polyMul(seg[idx(le,mi)],seg[idx(mi+1,ri)]); } //p即 S[l,r] void solve(int *res,con(int)le,con(int)ri,con(vint)p){ if(le==ri){res[le]=p[0];return;} int mi=(le+ri)>>1; solve(res,le,mi,polySubMul(p,seg[idx(mi+1,ri)],mi-le+1)); solve(res,mi+1,ri,polySubMul(p,seg[idx(le,mi)],ri-mi)); } void multiVal(int *f,con(int)n,int *pos,con(int)m,int *r){ static int tmp1[N+10],tmp2[N+10]; build(pos,0,m-1); int rt=idx(0,m-1); for(int i=0,ii=min(n,(int)seg[rt].size());i<ii;i++) tmp1[i]=seg[rt][i]; BASIC_POLY::polyInv(tmp1,tmp2,n); //T[0,n-1] 求個逆再和 f差卷積獲得 S[0,n-1] vint v1(n),v2(n); for(int i=0;i<n;i++) v1[i]=f[i],v2[i]=tmp2[i]; solve(r,0,m-1,polySubMul(v1,v2,m)); } }
給定 \(n\) 組 \((x_i,y_i)\),\(n-1\) 次多項式 \(f(x)\) 知足 \(\forall i,f(x_i)=y_i\),求 \(f(x)\)。
由若干個 \(n-1\) 次多項式疊加獲得 \(f(x)\)。具體構造以下:
這樣構造的目的是 \(g_i(x_j)\) 當且僅當 \(i=j\) 時 \(g_i(x_j)\neq0\),因而能夠將 \(g_0(x),g_1(x)\cdots g_{n-1}(x)\) 直接相加獲得 \(f(x)\)。
考慮對拉格朗日插值進行優化(優化計算方式以加速)。觀察 \(f(x)\) 的表達式:
先看看怎麼計算分式的分母部分,該部分對於固定的 \(i\) 來講是一個常數,記爲 \(k_i\)。
根據極限的相關知識,不難證實下面這個式子是成立的:
便於書寫,記 \(g(x)=\prod\limits_{i=0}^{n-1}(x-x_i)\)。分式上下都趨近於 \(0\),符合洛必達法則的適用條件——由此可得 \(k_i=g'(x_i)\)
。
能夠先用相似線段樹的分治(本質是啓發式合併)在 \(O(n\log n)\) 的複雜度內算出 \(g(x)\),而後 \(O(n)\) 多項式求導獲得 \(g'(x)\),再多點求值就能夠獲得 \(k_i\) 了。
再看 \(f(x)\),咱們如今能夠把它寫成
則須要解決後面這個式子。這其實能夠用到多點求值的舊方法中的一個技巧——仍然是分治:
分治
記 $h_{l,r}(x)$:
$$h_{l,r}(x)=\sum_{i=l}^r\frac{y_i}{k_i}\prod_{j\in[l,r]}^{j\neq i}(x-x_j)$$
仍然用相似線段樹的方法分治,考慮如何從 $h_{l,m}(x)$ 和 $h_{m+1,r}(x)$ 合併到 $h_{l,r}(x)$。
$$ \begin{aligned} S_{l,r}&=\prod_{i=l}^r(x-x_i)\\ h_{l,r}(x)&=h_{l,m}S_{m+1,r}+S_{l,m}h_{m+1,r} \end{aligned} $$
這樣就能夠 $O(n\log n)$ 求出答案。
總的複雜度就是 \(O(n^2+n\log n)\)
namespace UPPER_POLY{ typedef vector<int> vint; vint polyAdd(con(vint)a,con(vint)b){ int na,nb; vint c(max(na=(int)a.size(),nb=(int)b.size())); for(int i=0;i<na;i++) c[i]=a[i]; for(int i=0;i<nb;i++) c[i]=add(c[i],b[i]); return c; } vint polyMul(con(vint)a,con(vint)b){ int na=(int)a.size(),nb=(int)b.size(),nc=na+nb-1,l=BASIC_POLY::modelize(nc); static int tmp1[N+10],tmp2[N+10]; for(int i=0;i<na;i++) tmp1[i]=a[i];fill(tmp1+na,tmp1+l,0); for(int i=0;i<nb;i++) tmp2[i]=b[i];fill(tmp2+nb,tmp2+l,0); BASIC_POLY::ntt(tmp1,l,1),BASIC_POLY::ntt(tmp2,l,1); for(int i=0;i<l;i++) tmp1[i]=mul(tmp1[i],tmp2[i]); BASIC_POLY::ntt(tmp1,l,-1); vint c(nc); for(int i=0;i<nc;i++) c[i]=tmp1[i]; return c; } vint polySubMul(con(vint)a,con(vint)b,con(int)nc){ vint c=a; reverse(c.begin(),c.end()); c=polyMul(c,b); c.resize(a.size()); reverse(c.begin(),c.end()); c.resize(nc); return c; } vint seg[N+10]; #define idx(l,r) (((l)+(r))|((l)!=(r))) void build(int *a,con(int)le,con(int)ri){ if(le==ri){ int u=idx(le,ri); seg[u].clear(); seg[u].push_back(1),seg[u].push_back(sub(0,a[le])); return; } int mi=(le+ri)>>1; build(a,le,mi),build(a,mi+1,ri); seg[idx(le,ri)]=polyMul(seg[idx(le,mi)],seg[idx(mi+1,ri)]); } void solve1(int *res,con(int)le,con(int)ri,con(vint)p){ if(le==ri){res[le]=p[0];return;} int mi=(le+ri)>>1; solve1(res,le,mi,polySubMul(p,seg[idx(mi+1,ri)],mi-le+1)); solve1(res,mi+1,ri,polySubMul(p,seg[idx(le,mi)],ri-mi)); } void multiVal(int *f,con(int)n,int *pos,con(int)m,int *res){ build(pos,0,m-1); static int tmp1[N+10],tmp2[N+10]; int rt=idx(0,m-1); for(int i=0,ii=(int)seg[rt].size();i<n;i++) tmp1[i]=i<ii?seg[rt][i]:0; BASIC_POLY::polyInv(tmp1,tmp2,n); vint p1(n),p2(n); for(int i=0;i<n;i++) p1[i]=f[i],p2[i]=tmp2[i]; solve1(res,0,m-1,polySubMul(p1,p2,m)); } void build2(int *a,con(int)le,con(int)ri){ if(le==ri){ seg[idx(le,ri)].clear(); seg[idx(le,ri)].push_back(sub(0,a[le])),seg[idx(le,ri)].push_back(1); return; } int mi=(le+ri)>>1; build2(a,le,mi),build2(a,mi+1,ri); seg[idx(le,ri)]=polyMul(seg[idx(le,mi)],seg[idx(mi+1,ri)]); } vint solve2(int *y,con(int)le,con(int)ri){ if(le==ri) return vint(1,y[le]); int mi=(le+ri)>>1; return polyAdd(polyMul(solve2(y,le,mi),seg[idx(mi+1,ri)]),polyMul(seg[idx(le,mi)],solve2(y,mi+1,ri))); } vint multiPoly(int *pos,int *val,int n){ static int tmp1[N+10],tmp2[N+10]; build2(pos,0,n-1); for(int i=0,rt=idx(0,n-1);i<=n;i++) tmp1[i]=seg[rt][i]; BASIC_POLY::polyDet(tmp1,tmp1,n+1); multiVal(tmp1,n,pos,n,tmp2); build2(pos,0,n-1); //getinv tmp1[0]=tmp2[0];for(int i=1;i<n;i++) tmp1[i]=mul(tmp1[i-1],tmp2[i]); tmp1[n-1]=ina_pow(tmp1[n-1],MOD-2); for(int i=n-2;~i;i--){ int tmp1i=mul(tmp1[i+1],tmp2[i+1]); tmp1[i+1]=mul(tmp1[i+1],tmp1[i]); tmp1[i]=tmp1i; } for(int i=0;i<n;i++) tmp1[i]=mul(tmp1[i],val[i]); return solve2(tmp1,0,n-1); } }
若陪伴是我全部
那痕跡 藏匿了整個宇宙
——《聽風捕夢》By (×28)雙笙/封茗囧菌/司南
> Link 聽風捕夢-網易雲