Create fft_goo.cpp

EeeUnS · web-flow · commit 244db65dcfdd · 2019-12-04T13:35:41.000+09:00
diff --git a/docs/ch30/fft_goo.cpp b/docs/ch30/fft_goo.cpp
@@ -0,0 +1,131 @@
+
+
+#include <complex>
+#include <iostream>
+#include <valarray>
+
+
+using namespace std;
+
+typedef complex<double> base;
+
+void fft(vector<base> &a, bool inv)
+{
+    int n = a.size(), j = 0;
+    vector<base> roots(n/2);
+
+    for(int i=1; i<n; i++)
+    {
+        int bit = (n >> 1);
+        while(j >= bit)
+        {
+            j -= bit;
+            bit >>= 1;
+        }
+        j += bit;
+        if(i < j)
+            swap(a[i], a[j]);
+    }
+
+    double ang = 2 * acos(-1) / n * (inv ? -1 : 1);
+    for(int i=0; i<n/2; i++)
+    {
+        roots[i] = base(cos(ang * i), sin(ang * i));
+    }
+    /* In NTT, let prr = primitive root. Then,
+    int ang = ipow(prr, (mod - 1) / n);
+    if(inv) ang = ipow(ang, mod - 2);
+    for(int i=0; i<n/2; i++){
+    roots[i] = (i ? (1ll * roots[i-1] * ang % mod) : 1);
+    }
+    XOR Convolution : set roots[*] = 1.
+    OR Convolution : set roots[*] = 1, and do following:
+    if (!inv) {
+    a[j + k] = u + v;
+    a[j + k + i/2] = u;
+    } else {
+    a[j + k] = v;
+    a[j + k + i/2] = u - v;
+    }
+    */
+    for(int i=2; i<=n; i<<=1)
+    {
+        int step = n / i;
+        for(int j=0; j<n; j+=i)
+        {
+            for(int k=0; k<i/2; k++)
+            {
+                base u = a[j+k],
+                     v = a[j+k+i/2] * roots[step * k];
+                a[j+k] = u+v;
+                a[j+k+i/2] = u-v;
+            }
+        }
+    }
+    if(inv)
+        for(int i=0; i<n; i++)
+            a[i] /= n; // skip for OR convolution.
+}
+
+
+vector<lint> multiply(vector<lint> &v, vector<lint> &w)
+{
+    vector<base> fv(v.begin(), v.end()), fw(w.begin(), w.end());
+    int n =2;
+    while(n < v.size() + w.size())
+        n <<=1;
+    fv.resize(n);
+    fw.resize(n);
+    fft(fv,0);
+    fft(fw,0);
+    for(int i=0; i<n; i++)
+        fv[i] *= fw[i];
+    fft(fv,1);
+    vector<lint> ret(n);
+    for(int i=0; i<n; i++)
+        ret[i] = (lint)round(fv[i].real());
+    return ret;
+}
+
+vector<lint> multiply(vector<lint> &v, vector<lint> &w, lint mod)
+{
+    int n =2;
+    while(n < v.size() + w.size())
+        n <<=1s;
+    vector<base> v1(n), v2(n), r1(n), r2(n);
+    for(int i=0; i<v.size(); i++)
+    {
+        v1[i] = base(v[i] >> 15, v[i] & 32767);
+    }
+    for(int i=0; i<w.size(); i++)
+    {
+        v2[i] = base(w[i] >> 15, w[i] & 32767);
+    }
+    fft(v1,0);
+    fft(v2,0);
+    for(int i=0; i<n; i++)
+    {
+        int j = (i ? (n - i) : i);
+        base ans1 = (v1[i] + conj(v1[j])) * base(0.5,0);
+        base ans2 = (v1[i] - conj(v1[j])) * base(0, -0.5);
+        base ans3 = (v2[i] + conj(v2[j])) * base(0.5,0);
+        base ans4 = (v2[i] - conj(v2[j])) * base(0, -0.5);
+        r1[i] = (ans1 * ans3) + (ans1 * ans4) * base(0,1);
+        r2[i] = (ans2 * ans3) + (ans2 * ans4) * base(0,1);
+    }
+    fft(r1,1);
+    fft(r2,1);
+    vector<lint> ret(n);
+    for(int i=0; i<n; i++)
+    {
+        lint av = (lint)round(r1[i].real());
+        lint bv = (lint)round(r1[i].imag()) + (lint)round(r2[i].real());
+        lint cv = (lint)round(r2[i].imag());
+        av %= mod, bv %= mod, cv %= mod;
+        ret[i] = (av << 30) + (bv << 15) + cv;
+        ret[i] %= mod;
+        ret[i] += mod;
+        ret[i] %= mod;
+    }
+    return ret;
+}