题目:
对一个含有n个元素的集合来说,所谓k分位数(the kth quantile),就是能把已排序的集合分成k个大小相等的集合的k-1个顺序统计量。给出一个能列出某一集合的k分位数的O(nlgk)时间的算法
思路:
每个子集合的元素个数为t = n / k,A[j]是数组A中下标为j的元素,A(j)是数组是第j大的元素
则所求的k分位数是指A(t),A(2t),A(3t),……,A((k-1)t)
常规思路是按照顺序求第t小,第2t小。。。。的元素
按顺序依次求这k-1个数的运行时(k-1)*n
要使运行时间为O(nlgk),改进方法是不要依次寻找这k-1个数,而是借用二分的方法来找。
先找第k/2个分位数,再以这个分位数为主元把数组分为两段,分别对这两段来找分位数,这个时候找的范围变小了,效率也就提高了
代码如下:
//例题9.2中的算法的期望时间复杂度为O(n),而在9.3的例题中的最坏运行时间复杂度为O(n)。 //该算法实现思路是将数组每五个元素分为一组,最后一组可能不足五个。 //选出每一组中的中位数,然后选出这些中位数的中位数。根据这个中位数对数组进行划分为两组。 //然后再按照9.。2中的方法递归调用划分寻找第i小的数。 //该算法的对比于9.2的改进之处在于对partition方法进行了优化,而不是随进选择数组进行划分。 #include<iostream> using namespace std; //插入排序不解释 void Insert_sort(int a[],int p,int r) { int i,j,key,length; length=r-p+1; for(i=p+1;i<=r;i++) { key=a[i]; j=i-1; while(key<a[j]) { int temp; temp=a[j+1]; a[j+1]=a[j]; a[j]=temp; j=j-1; if(j<p) { break; } } } } //按照中位数的中位数进行分割 int Partition(int a[] ,int p,int r) { int i=p,j=0,temp,num,b[100]; //将a中每五个元素进行插入排序,并找出五个元素中的中位数放到b中 while(1) { if(i>r) { break; } if((i+4)<=r) { Insert_sort(a,i,i+4); b[j++]=a[i+2]; } else { Insert_sort(a,i,r); b[j++]=a[(r+i)/2]; } i+=5; } j=j-1; //对b中的元素进行排序 Insert_sort(b,0,j); //找到b中的中位数 num=b[j/2]; //将a中的num与a[r]替换 for(i=0;i<=r;i++) { if(num==a[i]) break; } temp=a[i]; a[i]=a[r]; a[r]=temp; //根据找到的num对数组进行划分 j=p-1; for(i=p;i<r;i++) { if(a[i]<num) { j++; temp=a[i]; a[i]=a[j]; a[j]=temp; } } temp=a[r]; a[r]=a[j+1]; a[j+1]=temp; return j+1; } //按照特定的数字num进行分割 int Partition1(int a[] ,int p,int r,int num) { int i,j=0,temp; //将a中每五个元素进行插入排序,并找出五个元素中的中位数放到b中 //将a中的num与a[r]替换 for(i=0;i<=r;i++) { if(num==a[i]) break; } temp=a[i]; a[i]=a[r]; a[r]=temp; //根据找到的num对数组进行划分 j=p-1; for(i=p;i<r;i++) { if(a[i]<num) { j++; temp=a[i]; a[i]=a[j]; a[j]=temp; } } temp=a[r]; a[r]=a[j+1]; a[j+1]=temp; return j+1; } //选择第num小的数字 int Select(int a[],int p,int r,int num) { if(p==r) { return a[p]; } int q=Partition(a,p,r); int k=q-p+1; if(k==num) { return a[q]; } else if(num<k) { return Select(a,p,q-1,num); } else { return Select(a,q+1,r,num-k); } } //将从小标为p到r的数组a分割成k个集合,该集合是从n+1个分割数开始的 void SelectKthQuantile(int a[],int b[],int p,int r,int k,int n) { if(k<=1) { return ; } int length,t,s; length=r-p+1; if(length%k!=0) { cout<<"不能划分为"<<k<<"个大小相等的集合!"<<endl; return ; } t=length/k; //选择中间的分割数 s=Select(a,p,r,(k+1)/2*t); b[n+(k+1)/2]=s; //利用该分割数将数组划分为两部分 Partition1(a,p,r,s); //本别对这两部分数组进行查找剩余的分割数 SelectKthQuantile(a,b,p,(n+(k+1)/2)*t-1,(k+1)/2,0); SelectKthQuantile(a,b,(n+(k+1)/2)*t,r,k/2,n+(k+1)/2); } int main() { int a[15]={16,48,748,742,1635,2,56,48,685,4596,3,4,1,6,5}; int b[100]; SelectKthQuantile(a,b,0,14,5,0); for(int i=1;i<5;i++) { cout<<b[i]<<" "; } cout<<endl; return 0; }