【XSY2612】Comb Avoiding Trees 生成函数 多项式求逆 矩阵快速幂

时间:2023-03-09 22:34:30
【XSY2612】Comb Avoiding Trees 生成函数 多项式求逆 矩阵快速幂

题目大意

  本题的满二叉树定义为:不存在只有一个儿子的节点的二叉树。

  定义一棵满二叉树\(A\)包含满二叉树\(B\)当且经当\(A\)可以通过下列三种操作变成\(B\):

  • 把一个节点的两个儿子同时删掉
  • 把一棵子树替换成根的的左子树或右子树。

  定义\(k\)连树为一棵只有恰好\(k\)个叶子的满二叉树,如果某个节点有一个右孩子,那么这个右孩子一定是一个叶子。

  对于给定的\(k\)和\(n\),对于所有在\(1\)到\(n\)之间的\(i\),你需要求出所有叶子节点恰好为\(i\),且不包含\(k\)连树的满二叉树个数。因为答案很大,请对\(998244353\)取模。

  \(n,k\leq 130000\)

题解

  设\(f_{i,j}\)为\(i\)个叶子不包含\(j\)连树的方案数。

  如果根的左儿子包含\(i\)连树那么这棵树就会包含\(i+1\)连树。

  如果根的右儿子包含\(i\)连树那么这棵树就会包含\(i\)连树。

  所以有:

\[f_{i,j}=\sum_{k=1}^{i-1}f_{k,j-1}f_{i-k,j}
\]

  这是一个\(O(n^2k)\)的DP。

  观察到上面这个东西是个卷积,看看生成函数有没有什么性质:

  设\(F_j(x)=\sum_{i=0}^\infty f_{i,j}x^i\)

\[\begin{align}
F_j(x)&=F_{j-1}(x)F_j(x)+x\\
F_j(x)&=\frac{x}{1-F_{j-1}(x)}
\end{align}
\]

  如果直接多项式求逆是\(O(kn\log n)\)的,很明显会TLE。

  设\(F_j(x)=\frac{A_j(x)}{B_j(x)}\)

\[\begin{align}
F_j(x)&=\frac{x}{1-\frac{A_{j-1}(x)}{B_{j-1}(x)}}\\
&=\frac{xB_{j-1}(x)}{B_{j-1}(x)-A_{j-1}(x)}\\
A_j(x)&=xB_{j-1}(x)\\
B_j(x)&=B_{j-1}(x)-A_{j-1}(x)
\end{align}
\]

\[\left[\begin{matrix}
A_j(x)&B_j(x)
\end{matrix}\right]
=
\left[\begin{matrix}
A_{j-1}(x)&B_{j-1}(x)
\end{matrix}\right]
\left[\begin{matrix}
0&-1\\
x&1
\end{matrix}\right]
\]

  那么这就是个常系数线性递推。易证\(A_k(x),B_k(x)\)的次数不超过\(\lfloor\frac{k}{2}\rfloor\),所以可以暴力矩乘+FFT做到\(O(k^2\log k)\),也可以把\(O(k)\)个单位根带进去做一波矩阵快速幂然后用IDFT插回来。

  最后直接求出\(A_k(x){B_k(x)}^{-1}\)的\(1\)到\(n\)项就可以了。

  时间复杂度:\(O(n\log n+k\log k)\)

  zjt:其实可以做到\(O(k\log k\log n)\)求一项的。详见zjt大佬的博客

代码

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cstdlib>
#include<ctime>
#include<utility>
#include<cmath>
#include<functional>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef pair<int,int> pii;
typedef pair<ll,ll> pll;
void sort(int &a,int &b)
{
if(a>b)
swap(a,b);
}
void open(const char *s)
{
#ifndef ONLINE_JUDGE
char str[100];
sprintf(str,"%s.in",s);
freopen(str,"r",stdin);
sprintf(str,"%s.out",s);
freopen(str,"w",stdout);
#endif
}
const ll p=998244353;
const ll g=3;
ll fp(ll a,ll b)
{
ll s=1;
while(b)
{
if(b&1)
s=s*a%p;
a=a*a%p;
b>>=1;
}
return s;
}
namespace orzzjt
{
struct mat
{
ll a[2][2];
mat()
{
memset(a,0,sizeof a);
}
ll *operator [](int x)
{
return a[x];
}
};
mat operator *(mat a,mat b)
{
mat c;
c[0][0]=(a[0][0]*b[0][0]+a[0][1]*b[1][0])%p;
c[0][1]=(a[0][0]*b[0][1]+a[0][1]*b[1][1])%p;
c[1][0]=(a[1][0]*b[0][0]+a[1][1]*b[1][0])%p;
c[1][1]=(a[1][0]*b[0][1]+a[1][1]*b[1][1])%p;
return c;
}
mat pow(mat a,int n)
{
mat s;
s[0][0]=s[1][1]=1;
while(n)
{
if(n&1)
s=s*a;
a=a*a;
n>>=1;
}
return s;
}
mat a,b;
pll calc(ll x,int n)
{
a[0][0]=0;
a[0][1]=-1;
a[1][0]=x;
a[1][1]=1;
b[0][0]=0;
b[0][1]=1;
b[1][0]=0;
b[1][1]=0;
a=pow(a,n-1);
b=b*a;
return pll(b[0][0],b[0][1]);
}
};
namespace ntt
{
ll w1[270010];
ll w2[270010];
int rev[270010];
int n;
void init(int m)
{
n=m;
int i;
for(i=2;i<=n;i<<=1)
{
w1[i]=fp(g,(p-1)/i);
w2[i]=fp(w1[i],p-2);
}
rev[0]=0;
for(i=1;i<n;i++)
rev[i]=(rev[i>>1]>>1)|(i&1?n>>1:0);
}
void ntt(ll *a,int t)
{
ll u,v,w,wn;
int i,j,k;
for(i=0;i<n;i++)
if(rev[i]<i)
swap(a[i],a[rev[i]]);
for(i=2;i<=n;i<<=1)
{
wn=(t==1?w1[i]:w2[i]);
for(j=0;j<n;j+=i)
{
w=1;
for(k=j;k<j+i/2;k++)
{
u=a[k];
v=a[k+i/2]*w%p;
a[k]=(u+v)%p;
a[k+i/2]=(u-v)%p;
w=w*wn%p;
}
}
}
if(t==-1)
{
ll inv=fp(n,p-2);
for(i=0;i<n;i++)
a[i]=a[i]*inv%p;
}
}
ll x[270010];
ll y[270010];
void copy_clear(ll *a,ll *b,int m)
{
int i;
for(i=0;i<m;i++)
a[i]=b[i];
for(i=m;i<n;i++)
a[i]=0;
}
void copy(ll *a,ll *b,int m)
{
int i;
for(i=0;i<m;i++)
a[i]=b[i];
}
void inverse(ll *a,ll *b,int m)
{
if(m==1)
{
b[0]=fp(a[0],p-2);
return;
}
inverse(a,b,m>>1);
init(2*m);
copy_clear(x,a,m);
copy_clear(y,b,m>>1);
ntt(x,1);
ntt(y,1);
int i;
for(i=0;i<n;i++)
x[i]=(2*y[i]%p-x[i]*y[i]%p*y[i]%p+p)%p;
ntt(x,-1);
copy(b,x,m);
}
};
ll w[270010];
ll a[270010];
ll b[270010];
ll c[270010];
int main()
{
open("b");
int m,n;
scanf("%d%d",&m,&n);
int i;
int k=1;
while(k<=(m>>1)+1)
k<<=1;
w[0]=1;
w[1]=fp(g,(p-1)/k);
for(i=2;i<k;i++)
w[i]=w[i-1]*w[1]%p;
ntt::init(k);
for(i=0;i<k;i++)
{
pll s=orzzjt::calc(w[i],m);
a[i]=s.first;
b[i]=s.second;
}
ntt::ntt(a,-1);
ntt::ntt(b,-1);
while(k<=n)
k<<=1;
ntt::inverse(b,c,k);
ntt::init(2*k);
ntt::ntt(a,1);
ntt::ntt(c,1);
for(i=0;i<2*k;i++)
a[i]=a[i]*c[i]%p;
ntt::ntt(a,-1);
for(i=1;i<=n;i++)
{
a[i]=(a[i]%p+p)%p;
printf("%lld\n",a[i]);
}
return 0;
}