快速傅里叶变换FFT / NTT

时间:2023-03-09 02:47:03
快速傅里叶变换FFT / NTT

FFT

参考blog:

十分简明易懂的FFT(快速傅里叶变换)

快速傅里叶变换(FFT)详解

(下面的图片是来自于这2篇博客里面的,仔细看可以发现右下角有水印……)

系数表示法

  一个一元\(n\)次多项式\(f(x)\)可以被表示为:$$f(x) = \sum_{i = 0}{n}a_{i}x{i}$$

  即用\(i\)次项的系数来表示\(f(x)\),展开就是\(f(x) = {a_{0}, a_{1}...a_{n}}\)

  

点值表示法

  把多项式看做一个函数,然后带入\(n\)个不同的\(x\),可以得到\(n\)个不同的\(y\),每对\((x, y)\)就组成一个点。

  其中,\(n\)个点可以唯一确定一个\(n\)次多项式。

  即用\(n\)个点来表示一个多项式

  

一些性质:

系数表达式相乘复杂度\(n^2\),点值表达式相乘复杂度\(O(n)\),听上去很神奇的样子。。。

设2个点值表达式分别为:

\(f(x) = \{(x_{0}, f(x_{0})), (x_{1}, f(x_{1}))... (x_{n}, f(x_{n}))\}\)

\(g(x) = \{(x_{0}, g(x_{0})), (x_{1}, g(x_{1}))... (x_{n}, h(x_{n})) \}\)

那么相乘得到:

\(h(x) = \{(x_{0}, f(x_{0}) * g(x_{0})), (x_{1}, f(x_{1}) * g(x_{1})) ... (x_{n}, f(x_{n}) g(x_{n})) \}\)

朴素系数转点值:DFT 复杂度\(O(n^2)\)

朴素点值转系数:IDFT 复杂度\(O(n^2)\)

复数

\(z = a + bi\),\(a\)为实部,\(b\)为虚部。

可以表示坐标系中的一个点\((a, b)\),同时一一对应向量\(\vec{ab}\),因此也符合向量的相加法则。

在极坐标上可以表示为\((r, \theta)\)。

一个性质:\((a_1, \theta_1) \cdot (a_2, \theta_2) = (a_1a_2, \theta_1 + \theta_2)\)

模长相乘,幅角相加

DFT(离散傅里叶变换)

  • 从这里开始的所有\(n\)默认可以表示为\(2^k\)

    原理:对于任意系数多项式转点值表示法,如果随意取\(n\)个\(x\)值代入计算,那么每次计算都是\(O(n)\)的,总复杂度\(O(n^2)\).

    如果取一些特殊的\(x\)值,使得\(f(x)\)可以快速计算,那么就可以在保证正确性的同时优化复杂度。

如果代入一些\(x\),使得每个\(x\)的若干次方等于\(1\),那么说不定我们就可以找到一些特殊性质。那么有哪些\(x\)符合这个条件呢?

显然\(\pm 1\)和\(\pm i\)都可以做到,但4个数明显不够用。

这个圆圈上面的点都可以做到.

快速傅里叶变换FFT / NTT

以原点为圆心,画一个半径为1的单位圆,那么单位圆上的所有点都可以经过若干次方得到1.

对这个圆进行\(n\)等分。

快速傅里叶变换FFT / NTT

以\(n = 8\)为例,从\((1, 0)\)开始,逆时针从\(0\)号开始标号,标到\(7\)号为止。记编号为\(k\)的点代表的复数为\(w_n^k\),那么由模长相乘,幅角相加可知\((w_n^1)^k = w_n^k\).

其中称\(w_n^1\)为\(n\)次单位根,并且每个\(w\)都可以被求出:

\[w_n^k = cos\frac{k}{n}2\pi + i \cdot sin\frac{k}{n}2\pi
\]

但如果我们暴力代入图中的\(w_n^0,w_n^1...w_n^{n - 1}\),复杂度还是\(n^2\),因此我们考虑寻找一下单位根的性质

单位根的性质

\(w_n^k = w_{2n}^{2k}\)

证明:$$w_n^k = cos\frac{k}{n}2\pi + i \cdot sin\frac{k}{n}2\pi$$

\[w_{2n}^{2k} = cos\frac{2k}{2n}2\pi + i \cdot sin\frac{2k}{2n}2\pi
\]

显然相等

\(w_n^{k + \frac{n}{2}} = - w_n^k\)

它们所代表的点关于原点对称,所代表的复数实部相反,所代表的向量等大反向

证明:$$w_n^{\frac{n}{2}} = cos\frac{\frac{n}{2}}{n}2\pi + i \cdot sin\frac{\frac{n}{2}}{n}2\pi$$

\[= cos\pi + i \cdot sin\pi = -1
\]

补充2个等式:

\[e^{ix} = cosx + i \cdot sinx
\]

\[e^{i\pi} + 1 = 0
\]

\[w_n^0 = w_n^n
\]

它们都等于\(1\),或者\(1 + 0i\)

\[(w_n^x)^y = w_n^{xy}
\]

FFT(快速傅里叶变换)

目的:系数转点值。

设$$A(x) = \sum_{i = 0}^{n - 1}a_ix^i = a_0 + a_1x + a_2x^2+...+a_{n - 1}x^{n - 1}$$

按下标奇偶性把\(A(x)\)分成2半,右边再提一个x.

\[A(x) = (a_0 + a_2x^2 + ... + a_{n - 2}x^{n - 2}) + (a_1x + a_3x^3 + ... + a_{n - 1}x^{n - 1})
\]

\[A(x) = (a_0 + a_2x^2 + ... + a_{n - 2}x^{n - 2}) + x(a_1 + a_3x^2 + ... + a_{n - 1}x^{n - 2})
\]

设$$A_1(x) = a_0 + a_2x + a_4x^2 + ... + a_{n - 2}x^{\frac{n}{2} - 1}$$

\[A_2(x) = a_1 + a_3x + a_5x^2 + ... + a_{n - 1}x^{\frac{n}{2} - 1}
\]

\[\Longrightarrow A(x) = A_1(x^2) + xA_2(x^2)
\]

设\(k < \frac{n}{2}\),代入\(w_n^k = x \longrightarrow A(x)\)

\[\Longrightarrow A(w_n^k) = A_1((w_n^k)^2) + W_n^k A_2((w_n^k)^2)
\]

\[= A_1(w_n^{2k}) + w_n^k A_2(w_n^{2k})
\]

\[= A_1(w_{\frac{n}{2}}^k) + w_n^kA_2(w_{\frac{n}{2}}^k)
\]

再代入\(k + \frac{n}{2}\)

再考虑另一半:

代入\(k + \frac{n}{2}\)

\[A(w_n^{k + \frac{n}{2}}) = A_1(w_n^{2k + n}) + w_n^{k + \frac{n}{2}}A_2(w_n^{2k + n})
\]

可以发现:

\[w^{k + \frac{n}{2}}_n = w_n^k \cdot w_n^{\frac{n}{2}} = -w^k_n
\]

\[w_n^{2k + n} = w_n^{2k} \cdot w_n^n = w_n^{2k}
\]

因此可以得到:

\[A(w_n^{k + \frac{n}{2}}) = A_1(w_n^{2k}) - w_n^kA_2(w_n^{2k})
\]

\[= A_1(w_{\frac{n}{2}}^k) - w_n^kA_2(w_{\frac{n}{2}}^{k})
\]

于是可以发现,这2个式子是长得很像的,因此我们可以在求出\(A(w_n^k)\)后\(O(1)\)的求出\(A(w_n^{k + \frac{n}{2}})\).

因为将式子一分为二后,每一部分仍然是一个子问题,因此可以用分治来做到\(nlogn\)求这个东西。

每次回溯时只扫前面一半序列,即可得到后面一半序列的答案,长度为1时只有一个常数项,可以直接返回。

大致就是把\(f(x)\)和\(g(x)\)分别转换为点值表达,然后\(O(n)\)的处理乘积,得到\(h(x)\)的点值表达

IFFT(快速傅里叶逆变换)

目的:点值转系数

设\((y_0, y_1, y_2..., y_{n - 1})\)为\((a_0, a_1, a_2, ..., a_{n - 1})\)的傅里叶变换(点值表达)。

设有另一个向量\((c_0, c_1, c_2, ..., c_{n - 1})\),满足\(c_k = \sum_{i = 0}^{n - 1}y_i(w_n^{-k})^i\).

即多项式\(B(x) = y_0 + y_1x + y_2x^2 + ... + y_{n - 1}x^{n - 1}\)在\(w_n^0, w_n^{-1},w_n^{-2}...w_{n - 1}^{-(n - 1)}\)处的点值表示。

于是对\(c_k = \sum_{i = 0}^{n - 1}y_i(w_n^{-k})^i\)进行化简

\[c_k = \sum_{i = 0}^{n - 1}y_i(w_n^{-k})^i
\]

\[= \sum_{i = 0}^{n - 1}(\sum_{j = 0}^{n - 1}a_j(w_n^i)^j)(w_n^{-k})^i
\]

\[= \sum_{i = 0}^{n - 1}(\sum_{j = 0}^{n - 1}a_j(w_n^j)^i)(w_n^{-k})^i
\]

\[= \sum_{i = 0}^{n - 1}(\sum_{j = 0}^{n - 1}a_j(w_n^j)^i(w_n^{-k})^i)
\]

\[= \sum_{i = 0}^{n - 1}\sum_{j = 0}^{n - 1}a_j(w_n^j)^i(w_n^{-k})^i
\]

\[= \sum_{i = 0}^{n - 1} \sum_{j = 0}^{n - 1}a_j(w_n^{j - k})^i
\]

\[= \sum_{j = 0}^{n - 1}a_j (\sum_{i = 0}^{n - 1}(w_n^{j - k})^i)
\]

设\(S(n) = \sum_{i = 0}^{n - 1}x^i\),将\(w_n^k\)代入得:$$S(w_n^k) = 1 + (w_n^k) + (w_nk)2 + ... + (w_nk){n - 1}$$

当\(k != 0\)得,等式两边同乘\(w_n^k\)得:$$w_nkS(w_nk) = w_n^k + (w_nk)2 + ... + (w_nk)n$$

两式相减得:

\[w_n^kS(w_n^k) - S(w_n^k) = (w_n^k)^n - 1
\]

\[S(w_n^k) = \frac{(w_n^k)^n - 1}{w_n^k - 1}
\]

\[S(w_n^k) = \frac{(w_n^k)^n - 1}{w_n^k - 1}
\]

\[S(w_n^k) = \frac{1 - 1}{w_n^k - 1} = \frac{0}{w_n^k - 1}
\]

\(\longrightarrow\)分子为0,分母不为0

  • 当\(k != 0\)时,\(S(w_n^k) = 0\);\(\quad\)当\(k = 0\)时,\(S(w_n^0) = n\)

    继续考虑刚才的式子:\(c_k = \sum_{j = 0}^{n - 1}a_j (\sum_{i = 0}^{n - 1}(w_n^{j - k})^i)\)
  • 当\(j != k\)时,值为\(0\);\(\quad\)当\(j = k\)时,值为\(n\)

    因此:$$c_k = na_k \Longrightarrow a_k = \frac{c_k}{n}$$

    于是我们得到了一个\(O(1)\)把一个点值变成一个系数的方法。

递归实现

不断将当前序列一分为二,递归求解。

但效率过低……

迭代实现

快速傅里叶变换FFT / NTT

观察到原序列和要求的序列之间有神奇的联系,,,

要求的序列的第i项就是原序列下标二进制的翻转。

因此我们可以\(O(n)\)预处理出要求的序列是怎么排的,然后再不断向上合并。

一些具体一点的东西:

因为求\(A_1,A_2\)的过程可以看做求一个新的\(A\),所以是一个子问题,对于分治区间\([l, r]\),目标是求当前区间的\(A\)数组,要用到的是当前\(A\)的\(A_1\)和\(A_2\)。

即\([l, mid]\)的\(A_1\)和\([mid + 1, r]\)的\(A_2\)。

每次,我们从\([l, mid]\)中的某个位置\(A[l + k]\)中取出当前所求\(A\)的对应\(A_1\),从\(A[l + k + mid]\)中取出当前所求\(A\)的对应的\(A_2\),然后用这2个值计算出\([l ,r]\)的\(A[l + k]\)和\(A[l + k + mid]\)

#include<bits/stdc++.h>
using namespace std;
#define R register int
#define AC 10001000
#define ld double
#define LL long long const double pi = acos(-1);
int n, m, maxn, lim = 1, len;
int Next[AC];//预处理出i对应的位置Next[i], 易知i = Next[Next[i]],所以不能交换2次,只能交换1次,不然就换回来了 struct node{
ld x, y;
node (ld xx = 0, ld yy = 0) {x = xx, y = yy;}
}a[AC], b[AC]; node operator * (node x, node y) {return node(x.x * y.x - x.y * y.y, x.x * y.y + x.y * y.x);}
node operator - (node x, node y) {return node(x.x - y.x, x.y - y.y);}
node operator + (node x, node y) {return node(x.x + y.x, x.y + y.y);} inline int read()
{
int x = 0;char c = getchar();
while(c > '9' || c < '0') c = getchar();
while(c >= '0' && c <= '9') x = x * 10 + c - '0', c = getchar();
return x;
} void pre()
{
n = read(), m = read();
for(R i = 0; i <= n; i ++) a[i].x = read();
for(R i = 0; i <= m; i ++) b[i].x = read();
while(lim <= n + m) lim <<= 1, ++ len;//寻找长度最接近的,可以覆盖a * b的2^len
for(R i = 0; i < lim; i ++)//一个长度为len的二进制串 = lim - 1
Next[i] = ((Next[i >> 1]) >> 1) | ((i & 1) << (len - 1));
}
//分治的最下面一层是求长度为1的,只有一个常数项的多项式,系数即为给定的系数值 void FFT(node *A, int opt)
{
for(R i = 0; i < lim; i ++)
if(i < Next[i]) swap(A[i], A[Next[i]]);
for(R i = 1; i < lim; i <<= 1)//上一层(被更新层)长度为2i,因为长度为1的不用处理……,所以要< lim,这样才可以保证2i <= lim
{//弧度 = 2pi / 2i = pi / i,那么因为是单位圆上的点,所以横坐标就是cos(弧度), 纵坐标就是sin(弧度)
node W(cos(pi / i), opt * sin(pi / i));//但是在还原为系数的时候用的是w_n^{-k},所以相当于把算出的纵坐标变成相反数,即乘opt
for(R r = i << 1, j = 0; j < lim; j += r)//枚举上一层每段的段首
{
node w(1, 0);//下面枚举上一层的一半,更新j + k时顺便更新j + k + i
for(R k = 0; k < i; k ++, w = w * W)//每次循环一次将w更新为下一个w_n^k
{
node x = A[j + k], y = w * A[j + k + i];
A[j + k] = x + y, A[j + k + i] = x - y;
}
}
}
} void work()
{
FFT(a, 1);
FFT(b, 1);
for(R i = 0; i < lim; i ++) a[i] = a[i] * b[i];
FFT(a, -1);
for(R i = 0; i <= n + m; i ++) printf("%d ", (int)(a[i].x / lim + 0.5));
} int main()
{
freopen("in.in", "r", stdin);
pre();
work();
fclose(stdin);
return 0;
}

NTT

用原根代替单位根。

若\((a, p) = 1\)且\(p > 1\),那么对于满足\(a^n \equiv 1\quad(mod \quad p)\)最小的\(n\),称为\(a\)是模\(p\)意义下的阶。

原根

设\(p \in N^+, a \in N\),若\(\delta_p(a) = \phi(p)\),则称\(a\)为\(p\)的一个原根,原根个数不唯一。若\(p\)有原根,那么它一定有\(\phi(\phi(p))\)个原根。

数\(m\)有原根的充要条件是\(m = 2, 4, p^a,2p^a\),其中\(p\)为奇素数\(a \ge 1\)

若\(p\)为素数,\(g\)是\(p\)的原根,那么\(g^i\%p(1 < g < p, 0 < i < p)\)的结果互不相同

一个结论:

\[w_n \equiv g^{\frac{p - 1}{n}} \quad (mod \quad p)
\]

\(p\)为\(998244353\)时,原根为\(3\).

求任意质数的原根:对于质数\(p\),质因子分解\(p - 1\)得到\(p_i\),若$$g^{\frac{p - 1}{p_i} != 1} \quad (mod \quad p)$$

恒成立,则\(g\)为\(p\)的原根。

实现方式:

基于普通FFT,对于opt = 1的情况,直接用\(g^{\frac{p - 1}{p_i}}\)代替,否则需要用\(g^{-\frac{p - 1}{p_i}}\)来代替,即\(g^{-k} = \frac{1}{g^k} = (\frac{1}{g})^k = inv[g] ^ k\)

(在FFT中,因为\(w^{-k}\)就相当于是向反方向转了相同角度,所以只需要乘\(-1\)即可)

#include<bits/stdc++.h>
using namespace std;
#define R register int
#define p 998244353
#define AC 10001000
#define LL long long const int G = 3, Gi = 332748118;
int n, m, lim = 1, len;
int a[AC], b[AC], rev[AC]; inline int read()
{
int x = 0;char c = getchar();
while(c > '9' || c < '0') c = getchar();
while(c >= '0' && c <= '9') x = x * 10 + c - '0', c = getchar();
return x;
} int qpow(int x, int have)
{
int rnt = 1;
while(have)
{
if(have & 1) rnt = 1LL * rnt * x % p;
x = 1LL * x * x % p, have >>= 1;
}
return rnt;
} void pre()
{
n = read(), m = read();
for(R i = 0; i <= n; i ++) a[i] = read();
for(R i = 0; i <= m; i ++) b[i] = read();
while(lim <= n + m) lim <<= 1, ++ len;
for(R i = 0; i < lim; i ++)
rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (len - 1));
} void NTT(int *A, int opt)
{
for(R i = 0; i < lim; i ++)
if(i < rev[i]) swap(A[i], A[rev[i]]);
for(R i = 1; i < lim; i <<= 1)
{
//int W = qpow((opt > 0) ? G : Gi, (p - 1) / (i << 1));
LL W = qpow(opt == 1 ? G : Gi , (p - 1) / (i << 1));
for(R r = i << 1, j = 0; j < lim; j += r)
for(R w = 1, k = 0; k < i; k ++, w = (1LL * w * W) % p)
{
int x = A[j + k], y = 1LL * w * A[j + k + i] % p;
A[j + k] = (x + y) % p, A[j + k + i] = (x - y + p) % p;
}
}
} void work()
{
NTT(a, 1);
NTT(b, 1);
for(R i = 0; i < lim; i ++) a[i] = 1LL * a[i] * b[i] % p;
NTT(a, -1);
int inv = qpow(lim, p - 2);//lim的逆元
for(R i = 0; i <= n + m; i ++) printf("%lld ", 1LL * a[i] * inv % p);
printf("\n");
} int main()
{
freopen("in.in", "r", stdin);
pre();
work();
fclose(stdin);
return 0;
}

扩展知识

分治fft/倍增fft求一行的斯特林数

分治fft