康托展开 & 逆康托展开
定义
康托展开是一个全排列到一个自然数的双射,常用于构建hash表时的空间压缩。
设有(n)个数((1,2,3,4,dots ,n)),组成不同(n!) 种的排列组合,其康托展开唯一且最大约为(n!)
康托展开表示的就是当前排列在(n)个不同元素的全排列中的名次。
时间复杂度(O(n^2))
适用范围
搜索,动态规划中常常用一个数字来表示一种状态,大大降低空间复杂度
公式
(X=a_1times(n?1)! a_2times(n?2)! ? a_ntimes0!)
(X) 代表当前排列在全排列中的排名
(a_i) 代表当前数是数列中未出现的数中第几小的 从0开始计数,0是第一小的数
例如 $ 4,2,3 ,1 $
(4) 是当前数列中未出现的数中第(3) 小的,(X = 3*(4-1)!)
(2) 是当前数列中未出现的数中第(1) 小的,(X = 1*(4-2)!)
(3) 是当前数列中未出现的数中第(1) 小的,(X =1*(4-3)!) ,因为(2) 已经输出过了,所以不算
(1) 是当前数列中未出现的数中第(0) 小的,(X = 0*(4-4)!)
这要就求出了(4,2,3 ,1) 所唯一对应的在全排列中的名次(X = 22)
- 注意到我们每次要用到 当前有多少个小于它的数还没有出现
- 这里用树状数组统计比它小的数出现过的次数就可以了,可以优化到(O(nlog{n}))
代码
先预处理阶乘
void init() {
fact[0] = 1;
for(int i = 1;i <= 9; i) fact[i] = fact[i - 1] * i;
// 递推求阶乘
}
(cantor)函数
int cantor(int a[],int n) {
bool st[10];// 标记数组
memset(st,0,sizeof st);
int res = 0;
for(int i = 0;i < n; i) {
int cnt = 0;
for(int j = 1;j < a[i]; j) if(!st[j]) cnt ;
// 找到a[i]是当前数列中未出现的数中第几小的
st[a[i]] = 1;// 把这个数删掉
res = cnt * fact[n - i - 1];// 累加值
}
return res 1;// 如果输出的是排名就要 1,如果是hash值可以直接返回 res
}
逆康托展开
因为排列的排名和排列是一一对应的,所以康托展开满足双射关系,是可逆的。
可以通过类似上面的过程倒推回来。
首先把排名(X) 减去(1) ,变成以(0) 开始的排名
例如求 (1,2,3,4) 的全排列序列中,排名第(22) 的序列是什么
(22 - 1 = 21) , (21) 代表着有多少个排列比这个排列小
第一个数 (a[1])
(lfloor{21/(4-1)!}rfloor = 3) 比$a[1] $ 小且没有出现过的数有(3) 个,(a[1]=4)
(X=Xmod3times(4-1)!=3)
第二个数(a[2])
(lfloor{3/(4-2)!}rfloor=1) 比(a[2]) 小且没有出现过的数有(1) 个,所以(a[2]=2)
(X=Xmod1times(4-2)!=1)
第三个数(a[3])
(lfloor{1/(4-3)!}rfloor=1) 比(a[3]) 小且没有出现过的数有(1) 个,所以(a[3]=3)
(X=Xmod1times(4-3)!=0)
第四个数(a[4])
(lfloor{0/(4-4)!}rfloor=0) 比(a[4]) 小且没有出现过的数有(0) 个,所以(a[4]=1)
最终得到数列(4,2,3,1)
代码
vector<int> incantor(int x,int n) {
x--;// 得到以0开始的排名
vector<int> res(n);// 保存数列答案
int cnt;
bool st[10];// 标记数组
memset(st,0,sizeof st);
for(int i = 0;i < n; i) {
cnt = x/fact[n - i - 1];// 比a[i]小且没有出现过的数的个数
x %= fact[n - i - 1];// 更新 x
for(int j = 1;j <= n; j) {// 找到a[i],从1开始向后找
if(st[j]) continue;// 如果被标记过,就跳过
if(!cnt) {// 如果cnt == 0说明当前数是a[i]
st[j] = 1;//标记
res[i] = j;// 第i位是j
break;
}
cnt --;// 如果当前不是0,就继续往后找
}
}
return res;// 返回答案
}