「loj3058」「hnoi2019」白兔之舞

时间:2022-04-14 09:25:14

题意

有一个\((L+1)*n\) 的网格图,初始时白兔在\((0,X)\) , 每次可以向横坐标递增,纵坐标随意的位置移动,两个位置之间的路径条数只取决于纵坐标,用\(w(i,j)\) 表示,如果要求白兔停下的点纵坐标为\(Y\) 依次输出移动的步数对\(k\) 取模为 $0 - k -1 $的方案数;

\(p\)为质数且$10^8 \lt p \lt 2^{30} , 1 \le n \le 3 , 1 \le x , y \le n , 0 \le w(i,j) \lt p , 1 \le k \le 65536 , \le L \le 10^8 $,

满足\(k\)是\(p-1\)的一个约数;

题解

  • 即求:$ f_r = \sum_{i=0}{L}(L_i) (A^i)_{X,Y} [ i \ mod \ k = r] $

  • $Part \ 1 $

  • 单位根反演:

\[根据求和引理:\\
\frac{1}{n} \sum_{j=0}^{n-1}\omega_n^{ij} =
\begin{cases}
1 \ \ \ i \ mod \ n = 0 \\ 0 \ \ \ i \ mod \ n \neq 0 \\
\end{cases}
\\这个等比数列求和即可证明;
\\用这个来换掉式子中的取模:\\
\begin{align}
&=\sum_{i=0}^{L}(^L_i)A^i_{x,y}\frac{1}{k}\sum_{j=0}^{k-1} \omega_k^{(i-r)j}\\
&=\frac{1}{k}\sum_{i=0}^{k-1}\omega_k^{-ir}\sum_{j=0}^{L}(^L_j)(A^j)_{x,y}\times \omega^{ij}_k\\
&=\frac{1}{k}\sum_{i=0}^{k-1}\omega_k^{-ir}(w^i_kA+I)^L_{x,y}\\
&=\frac{1}{k}\sum_{i=0}^{k-1}a_i\omega_k^{-ir}
\end{align}\]
  • 当\(k = 2^x\)次方时,可以用裸的\(fft\)求出答案;

  • \(Part 2\)

  • 但是没有必要,当 \(k\) 为任意数,由于\(k \ | \ mod - 1\),所以\(\omega_k\)可以用原根的\((mod-1)/k\)来代替;

  • 同时注意到: $ ab = (^{a+b}_2) - (^a_2) - (^b_2) $

  • $ f_r = \frac{1}{k}w_k{(r_2)} \sum_{i=0}^{k-1}a_i \omega _k{(i_2)} \times \omega_k{-({i+r}_2)} $

  • 直接reverse+mtt即可;

    //注意mtt的精度;
    #include<bits/stdc++.h>
    #define ll long long
    #define ld double
    using namespace std;
    const int N=1<<20;
    int n,k,l,X,Y,mod,a[N],b[N],A[N],B[N],C[N],fac[N],tot;
    char gc(){
    static char*p1,*p2,s[1000000];
    if(p1==p2)p2=(p1=s)+fread(s,1,1000000,stdin);
    return(p1==p2)?EOF:*p1++;
    }
    int rd(){
    int x=0;char c=gc();
    while(c<'0'||c>'9')c=gc();
    while(c>='0'&&c<='9')x=(x<<1)+(x<<3)+c-'0',c=gc();
    return x;
    }
    int pw(int x,int y){
    int re=1;
    while(y){
    if(y&1)re=(ll)re*x%mod;
    y>>=1;x=(ll)x*x%mod;
    }
    return re;
    }
    int find_rt(int p){
    int tmp=p-1;
    for(int i=2;i*i<=tmp;++i)if(tmp%i==0){
    fac[++tot]=i;
    while(tmp%i==0)tmp/=i;
    }
    if(tmp!=1)fac[++tot]=tmp;
    for(int i=2;;++i){
    int fg=0;
    for(int j=1;j<=tot;++j)if(pw(i,(p-1)/fac[j])==1){fg=1;break;}
    if(!fg)return i;
    }
    return 0;
    }
    struct Mat{
    int a[3][3];
    void init(){
    memset(a,0,sizeof(a));
    for(int i=0;i<n;++i)a[i][i]=1;
    }
    Mat operator *(const int&A){
    Mat re;
    for(int i=0;i<n;++i)
    for(int j=0;j<n;++j)re.a[i][j]=(ll)a[i][j]*A%mod;
    return re;
    }
    Mat operator *(const Mat&A){
    Mat re;
    for(int i=0;i<n;++i)
    for(int j=0;j<n;++j){
    re.a[i][j]=0;
    for(int k=0;k<n;++k){
    re.a[i][j]+=(ll)a[i][k]*A.a[k][j]%mod;
    if(re.a[i][j]>=mod)re.a[i][j]-=mod;
    }
    }
    return re;
    }
    Mat operator +(const Mat&A){
    Mat re;
    for(int i=0;i<n;++i)
    for(int j=0;j<n;++j){
    re.a[i][j]=a[i][j]+A.a[i][j];
    if(re.a[i][j]>=mod)re.a[i][j]-=mod;
    }
    return re;
    }
    }mp,I;
    int pw(Mat x,int y){
    Mat re;re.init();
    while(y){
    if(y&1)re=re*x;
    y>>=1;x=x*x;
    }
    return re.a[X][Y];
    }
    struct com{
    ld x,y;
    com(ld _x=0,ld _y=0):x(_x),y(_y){};
    com operator +(const com&A)const{return com(x+A.x,y+A.y);}
    com operator -(const com&A)const{return com(x-A.x,y-A.y);}
    com operator *(const com&A)const{return com(x*A.x-y*A.y,x*A.y+y*A.x);}
    com operator /(const ld&A)const{return com(x/A,y/A);}
    com operator !()const{return com(x,-y);}
    };
    namespace poly{
    const ld pi=acos(-1);
    int L,len,rev[N];com Wn[N];
    void init(int l){
    for(L=0,len=1;len<=l<<1;len<<=1,++L);
    for(int i=0;i<len;++i)rev[i]=(rev[i>>1]>>1)|((i&1)<<(L-1));
    //Wn[0]=com(1,0);Wn[1]=com(cos(pi/len),sin(pi/len));
    //for(int i=2;i<len;++i)Wn[i]=Wn[i-1]*Wn[1];
    for(int i=0;i<len;++i)Wn[i]=com(cos(pi*i/len),sin(pi*i/len));
    }
    void fft(com*A,int f){
    for(int i=0;i<len;++i)if(i<rev[i])swap(A[i],A[rev[i]]);
    for(int i=1;i<len;i<<=1){
    for(int j=0;j<len;j+=i<<1){
    for(int k=0;k<i;++k){
    com w=~f?Wn[len/i*k]:!Wn[len/i*k];//
    com x=A[j+k],y=w*A[j+k+i];
    A[j+k]=x+y;A[j+k+i]=x-y;
    }
    }
    }
    if(!~f)for(int i=0;i<len;++i)A[i]=A[i]/len;
    }
    void mtt(int*A,int*B,int*C){
    static com t1[N],t2[N],t3[N],t4[N];
    int all=(1<<15)-1;
    for(int i=0;i<len;++i){
    t1[i]=com(A[i]>>15,A[i]&all);
    t2[i]=com(B[i]>>15,B[i]&all);
    }
    fft(t1,1);fft(t2,1);
    for(int i=0;i<len;++i){
    com x1=t1[i],y1=!t1[len-i&len-1];
    com x2=t2[i],y2=!t2[len-i&len-1];
    t3[i] = (x1+y1)*x2*com(0.5,0);//(x1+y1)/2(x2+y2)/2 + (x1+y1)/2(x2-y2)/2i * i ;
    t4[i] = (x1-y1)*x2*com(0,-0.5);//(x1-y1)/2i(x2+y2)/2 + (x1-y1)/2i(x2-y2)/2i * i ;
    }
    fft(t3,-1);fft(t4,-1);
    for(int i=0;i<len;++i){
    C[i] = (((ll)(t3[i].x+0.5)%mod <<30)%mod +
    ((ll)(t3[i].y+0.5)%mod <<15)%mod +
    ((ll)(t4[i].x+0.5)%mod <<15)%mod +
    (ll)(t4[i].y+0.5)%mod ) %mod ;
    }
    }
    }
    int main(){
    // freopen("dance.in","r",stdin);
    // freopen("dance.out","w",stdout); n=rd();k=rd();l=rd();X=rd()-1;Y=rd()-1;mod=rd();I.init();
    for(int i=0;i<n;++i)for(int j=0;j<n;++j)mp.a[i][j]=rd();
    int G=find_rt(mod),wk=pw(G,(mod-1)/k); for(int i=0,w=1;i<k;++i,w=(ll)w*wk%mod)a[i]=pw((mp*w+I),l);
    for(int i=0;i<=k-1<<1;++i)b[i]=pw(wk,(ll)i*(i-1)/2%(mod-1));
    for(int i=0;i<k;++i)A[i]=(ll)a[i]*b[i]%mod;
    for(int i=0;i<=k-1<<1;++i)B[i]=pw(b[(k-1<<1)-i],mod-2); poly::init(k-1<<1);
    poly::mtt(A,B,C);
    int iv=pw(k,mod-2);
    for(int i=0;i<k;++i){
    int now = (ll)iv*b[i]%mod*C[(k-1<<1)-i]%mod;
    printf("%d\n",now);
    } return 0;
    }