任意模数NTT求卷积

2019-04-13 16:53发布生成海报

站内文章 / 模拟电子

15078 0

class="markdown_views prism-atom-one-light"> 解决模数M不是NTT模数的情况。

多模数NTT

一般取三个模数p1p2p3做NTT，要求满足

p 1 p 2 p 3 > n M^{2}

，即CRT模数比结果序列值要大。
然后用中国剩余定理(CRT)合并出值。
但是由于三个模数乘起来爆long long了，我们需要一些特殊trick。首先将两个模数合并，方程变为两条

x \equiv a 1 \mod p 1

x \equiv a 2 \mod p 2

也即

x = a 1 + k p 1 = a 2 + z p 2

两边同时模上

p 2

，求p1的逆元后可以计算出k在模p2意义下的值。又因为我们所求是

(a 1 + k p 1) \mod p 1 p 2

也就是

(a 1 + (k p 1 \mod p 1 p 2)) \mod p 1 p 2

右边括号部分展开一下，不难发现为(~~这是常识然而我并不会~~)

p 1 (k \mod p 2)

又因为值域小于p1p2，这就是原始值。
从而可以计算出x。求出k后所有操作都应在

\mod M

意义下进行。共

9

次NTT。。。心态是不是有点崩。据说立大爷的做法是将三模数换成一大一小模数再用O(1)黑科技乘，这样可以做到6次。

毛爷爷用拆系数fft的方式来代替ntt.
我们考虑直接将两个多项式用fft卷积，发现值域是

10^{23}

，超出double精度范围了。因此设一个阈值K(通常为

2^{15}

)
将两个多项式每一项的系数拆分为

a K + b

做fft.

(K A + B) (K C + D)

化简后

K^{2} A C + K (B C + A D) + B D

将AC做卷积后，对应系数为乘上

K^{2}

（这个时候浮点数转为整数）加到答案中去。
其他类推。将BC+AD放到一个多项式里idft，数一下是7次dft。然而，因为ACidft回去后的虚部是空的，可以将

B D \cdot i

加到AC中，这样一起idft回去，虚部就是BD。少一次dft。当阈值为

2^{15}

，长度为

1 e 5

时，可以发现值域是

1 e 14

的，符合double精度范围。
注意单位根不能递推求，否则精度误差呈指数级上升。
虽然理论上精度没毛病，但实际上依旧会有较大误差，需要加上一个0.5来进行四舍五入。
（好不靠谱的感觉）

假如我当前要求A,B的dft，那么将B放到A的虚部中，称作Q 做一次DFT。
对于A或B的位置i，设其值为x，那么根据dft的意义，对DFT后第w位的贡献是

x \cdot (g_{n}^{w})^{i}

g是复数根。对于位置w，就相当于我们要求

\sum x (\cos θ + I \cdot \sin θ)

（theta是那个单位根的i次方对应的角度。）
看看Q[i]DFT后对A’[w]和B’[w]的贡献是什么。

(A i + I \cdot B i) \cdot (g_{n}^{w})^{i}

= (A i + I \cdot B i) \cdot (\cos θ + I \cdot \sin θ)

发现我们可以同时知道

A i \cdot cos - B i \cdot sin 与 B i \cdot cos + A \cdot sin " role="presentation">