Miller-Rabin判质数和Pollared-Rho因数分解

时间:2024-12-18 08:08:01

朴素判质数:$ 在[2..\sqrt{n}]$范围内枚举逐一判断是不是$ n$的因数

时间复杂度:$ O(\sqrt{n})$

当n达到$ 10^{18}$级别时,显然效率过低

Miller-Rabin算法                                                                               

这种算法本质上是一种基于概率的素数判断方法,因为复杂度小以及有极大的正确率而常被应用

费马小定理                                                                                          

对于一个素数$ p$和任意正整数$ x$有$ x^{p-1} \equiv 1 (mod\ p)$

那对于这个命题的逆命题呢?有高概率成立

因而很容易想到选用几个不同的底数逐一验证,只要有一个不满足则非素数

但由于有强伪素数的存在(即对于任何底数x这种伪素数都有素数性质)使得仅如此不管用多少底数都有误差

二次探测定理                                                                                       

若$ p$为素数且$ x^2 \equiv 1(mod\ p)$

则有$ x \equiv 1(mod\ p)\ or\ x \equiv p-1(mod\ p)$

证明:

由$ x^2 \equiv 1(mod\ p)$可得$ (x+1)(x-1) \equiv 0(mod\ p)$

即$ p|(x+1)(x-1)$

又∵$ p$是素数因而$ p|(x+1)\ or\ p|(x-1)$

得证

应用                                                                                                     

以测试数$ 341$,底数$ 2$为例,这个伪素数满足$ 2^{340} \equiv 1 (mod\ 341)$

那么如果$ 341$是素数,根据二次探测定理显然有$ 2^{170} \equiv 1 (mod\ 341)$或$ 2^{170} \equiv 340 (mod\ 341)$

计算发现确实如此,由于$ 170$仍为偶数,递归验证$ 2^{85}\mod\ 341$

发现结果是$ 22$,并非$ 1$或者$ 340$

如此就把$ 341$这个伪素数揪出来了

找规律发现

对于一个素数$ p$,这样递归得到的对应结果序列应为$ 1\ \ 1\ \ 1 ...p-1$,即经过$ p-1$($ p-1$之后会无序)或全为$ 1$(即不会经过$ p-1$)对于一个非素数$ p$,递归得到的对应结果序列一般不会以$ p-1$结尾,绝大多数情况下甚至不以1开头

那么我们直接从最大的$ p-1$的因数的奇数开始(这时候模后结果由于可能在$ p-1$后因而无序)

不断自身平方直到对应结果为$ p-1$或已经跳到$ p-1$

如果经过了对应结果$ p-1$的时候则有极高概率为素数(虽然并不完全正确)

当然也有可能这个奇数的对应结果直接为$ 1$,这时候也满足素数数性质(即整个结果序列均为$ 1$)(虽然也不完全保证是素数)

这样对于一个底数的测试复杂度仅有一个$ log$

如果只使用$ 2,3,7,61$四个因数至少可以保证$ 10^9$之内不存在任何反例

如果选用$ 2,3,7,61,24251$那么在$ 10^{16}$内只存在$ 46856248255981$这一个反例

正确率高到基本能满足所有$ long\ long$范围内的素数测试

代码:(此份是int范围内的)                                                           

#include<cmath>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#define rt register int
#define ll long long
using namespace std;
ll read()
{
ll x = ; int zf = ; char ch;
while (ch != '-' && (ch < '' || ch > '')) ch = getchar();
if (ch == '-') zf = -, ch = getchar();
while (ch >= '' && ch <= '') x = x * + ch - '', ch = getchar(); return x * zf;
}
int ksm(ll x,int y,const int p)
{
if(!y)return ;int ew=;
while(y>)
{
if(y&)y--,ew=x*ew%p;
x=x*x%p;y>>=;
}
return x*ew%p;
}
int pri[]={,,,};
bool check(const int x)//用2,3,7,61检验x
{
if(x==)return ;
if(x==||x==||x==||x==||x==||x==)return ;
if(x%==||x%==||x%==||x%==||x%==)return ;//小剪枝
for(rt i=;i<=;i++)
{
int d=x-;
while(!(d&))d>>=;//找到最大的奇数因数
int s=ksm(pri[i],d,x);
while(s!=&&s!=x-&&d!=x-)d<<=,s=(ll)s*s%x;
//只要不是1或x-1或者整段序列已经遍历完毕就一直网上跳
if(s!=x-&&!(d&))return ;//如果不存在x-1且序列最后一个不是1则为合数
}
return ;
}
int main()
{
int n=read(),m=read();
while(m--)puts(check(read())?"Yes":"No");
return ;
}

$ Pollared-Rho$算法                                                                        

Pollared-Rho是用于质因数分解的随机算法

模板: 求$ \phi(n)$, $ n<=10^{18}$   here

朴素算法:在$ [2..\sqrt{n}]$范围内枚举质数判断是否为n的因数,然后直接计算

如果$ n$是$ 10^9$规模的两个质数相乘,复杂度显然过大

随机算法:

在$ [2..n]$范围内每次随机一个数,判断是否是x的因数

这种算法的复杂度均摊是$ O(n)$规模的,甚至劣于暴力

引出$ Pollard-Rho$算法                                                                   

主要思想:对于一个大整数$ n$,我们取任意一个数$ x$使得$ x$是$ n$的因数的几率很小,但如果取两个数作差使得差为n的因数的几率就提高了,如果判断的是$ gcd(|x1-x2|,n)>1$那么概率会更高,这就是$ Pollard-Rho$的主要思想.

如何取随机数?

生成一个伪随机数列,这里定义伪随机函数为对于一个值$ x$和种子$ seed$会返回固定的新值

一般令当前$ seed$的$ x$的下一项为$ Nex(x)=x*x+seed (mod \ n)$

每次选取数列中相邻两个作差判断

可能会形成循环?

对!要的就是循环!

复杂度证明:                                                                                     

根据生日悖论,有在整数域$ [1..n]$范围内随机约$ \sqrt{n}$个数,就有约二分之一的概率存在两个相同的数.我们伪随机k个数,标号$ a1..ak$,令$ n$中最小的质因子为$ n1$,则有$n1<= \sqrt{n}$

将$ a$数组对$ n1$取模后的数组称为$ b$数组

则当$ b$数组出现循环的时候(约在$ n^{\frac{1}{4}}$处)$ a$数组有极大概率不进入循环

因为$ a$数组出现循环的期望位置约在$ n^{\frac{1}{2}}$处

此时若a尚未进入循环,则必存在某$ i ≠j$满足$ b[i]==b[j]$且$ a[i]!=a[j]$, 此时必有$ n1|abs(a[i]-a[j])$

因而在约进行$ n^{\frac{1}{4}}$次运算后跑出一个因数

复杂度:$ O(n^{\frac{1}{4}}log_2n)$ //不能忽略$ gcd$的复杂度

如果$ a$数组和$ b$数组同时进入循环?

暴力一点,更换一个$ seed$再次重复上述内容

如何判环?                                                                                        

可以采用$ floyd$判环

即对于每个当前随机数$ x,a$每次走一步,$ b$每次走两步,每次计算$ gcd(|a-b|,n)$

即每次$ a=Nex(a),b=Nex(Nex(b))$

而不是像之前一样$ b$在$ a$前一步然后每次$ a,b$都走一步

如果$ a,b$在同一环上显然存在某一时刻$ b$追上$ a$,即$ b$的值等于$ a$的值

这时候就直接跳出换一个新的$ seed$即可

期望换$ seed$的次数很小,因而复杂度可以满意

得到一个因数之后$ Miller-Rabin$判断是否是质数,如果不是递归继续,把得到的质数用$ map$存下来计算即可

代码:                                                                                               

#include<cmath>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<map>
#define rt register int
#define l putchar('\n')
#define ll long long
#define r read()
using namespace std;
ll read()
{
ll x = ; int zf = ; char ch;
while (ch != '-' && (ch < '' || ch > '')) ch = getchar();
if (ch == '-') zf = -, ch = getchar();
while (ch >= '' && ch <= '') x = x * + ch - '', ch = getchar(); return x * zf;
}
ll lowpow(ll x,ll y,ll p)
{
//计算x*y %p 防止爆long long;
ll ew=;
while(y>)
{
if(y&)y--,ew=(ew+x)%p;
else x=(x<<)%p,y>>=;
}
return (x+ew)%p;
}
ll ksm(ll x,ll y,const ll p)//快速幂
{
if(!y)return ;ll ew=;
while(y>)
{
if(y&)y--,ew=lowpow(x,ew,p);
x=lowpow(x,x,p);y>>=;
}
return lowpow(x,ew,p);
} int pri[]={,,,};
bool check(const ll x)//用2,3,7,61检验素数
{
if(x==||x==||x==||x==||x==||x==)return ;
if(x%==||x%==||x%==||x%==||x%==)return ;
if(x==)return ;
for(rt i=;i<=;i++)
{
ll d=x-;
while(!(d&))d>>=;
ll s=ksm(pri[i],d,x);
while(s!=&&s!=x-&&d!=x-)d<<=,s=(ll)lowpow(s,s,x);
if(s!=x-&&!(d&))return ;
}
return ;
}
ll seed;//随机种子
ll Nex(ll x,ll p)
{
return (lowpow(x,x,p)+seed)%p;//生成伪随机序列中x的下一项
}
ll gcd(ll x,ll y)
{
return (!y)?x:gcd(y,x%y);
}
map<ll,int>s;ll ans=;
void Pollared_Rho(ll n)
{
if(check(n))//如果n已经是素数
{
s[n]++;
if(s[n]==)ans=ans*(n-);else ans=ans*n;//计算φ
return;
}
while()//如果a,b在同一环中就不断重复
{
seed=rand()%(n-)+;//新建随机种子
ll a=rand()%(n-)+,b=Nex(a,n);//随机a,b初值
while(a!=b)
{
ll num=gcd(n,abs(a-b));
if(num>)
{
Pollared_Rho(num);
Pollared_Rho(n/num);
return;
}
a=Nex(a,n);b=Nex(Nex(b,n),n);//b每次比a多走一步
}
}
}
int main()
{
ll u=r;
if(u==)
{
cout<<;
return ;
}
Pollared_Rho(u);
cout<<ans;
return ;
}