二路归并算法的java实现

时间:2021-08-19 18:08:52

“归并”的含义是将两个或者两个以上的有序表组合成一个新的有序表。

假设待排序表含有n个元素,则可以看成是n个有序的子表,每个子表的长度为1,然后两两归并,得到(n/2)或者(n/2+1)个长度为2或1的有序表;再两两归并。。。

如此重复,直到合并成一个长度为n的有序表为止。

这种方法称为二路归并排序算法。

直接上代码:

package com.mergeSort;

public class MergeSort {

    //归并排序的对外公共接口
public static void mergeSort(int arr[],int n){
subMergeSort(arr,0,n-1);
} //实现归并排序
private static void subMergeSort(int[] arr, int l, int r) { //当l=r时即将待排序序列二分到每组只有一个元素时,对于一个元素来说,它自己就是有序的
if(l>=r)
return;
int mid=(l+r)/2;
subMergeSort(arr,l,mid);//归并排序前半段
subMergeSort(arr,mid+1,r);//归并排序后半段
//将两段有序序列归并成一段有序序列
mergeSortCore(arr,l,mid,r); } //将两段有序序列归并成一段有序序列
//对arr[l...mid]和arr[mid+1,r]两部分进行归并
private static void mergeSortCore(int[] arr, int l, int mid, int r) { //开辟出辅助数组
int[] a=new int[r-l+1];
//将原数组全部元素复制到辅助数组
for(int i=l;i<=r;i++)
a[i-l]=arr[i]; //a数组是从0开始的,因此和arr数组存在l个偏移量
//定义两个指针,分别指向两段有序序列的起始位置
int j=mid+1;
int i=l;
//用k作指针将排序后的数组元素重新放到原数组arr[l...r]中
for(int k=l;k<=r;k++){
//当前半段都放入arr中而后半段还没有遍历完
if(i>mid){
arr[k]=a[j-l];
j++;
}else
//当后半段都放入arr中而前半段还没有遍历完
if(j>r){
arr[k]=a[i-l];
i++;
}
else
//若两段都没遍历完,那么就比较一下
if(a[i-l]<a[j-l]){
arr[k]=a[i-l];
i++; //别忘了每搞定一个元素,指针的后移
}
else
{
arr[k]=a[j-l];
j++;
}
}
} public static void main(String[] args){
int[] arr=new int[]{10,9,8,7,6,5,4,3,2,1};
mergeSort(arr,10);
for(int i=0;i<arr.length;i++)
System.out.print(arr[i]+" ");
} }

注意:

1)归并排序需要一个新建一个辅助数组;

2)本段代码中排序数组的每段都是两头包括的闭区间,例如arr[l...mid]。当然也可以定义成一头开一头闭的区间,例如arr[l...mid+1),只不过相关代码需要做相应的改动。

3)代码中划下划线的部分,即 int mid=(l+r)/2; 在数据量很大的时候(即l和r很大的时候),有可能会造成mid的值的溢出。

4)该排序算法的时间复杂度为O(nlog2n)。

5)是稳定的。

对二路排序算法的优化:


1)在上面代码中实现归并排序的subMergeSort方法中有这么一个片段:

subMergeSort(arr,l,mid);//归并排序前半段
subMergeSort(arr,mid+1,r);//归并排序后半段
//将两段有序序列归并成一段有序序列
mergeSortCore(arr,l,mid,r);

这段代码中,我们对每一次单独排序完的两段都进行了一次mergeSortCore()方法的归并操作。

但是因为这两段各自内部都是有序的,那么当arr[mid]<=arr[mid+1]时,我们就没有必要再去操作mergeSortCore()方法,

因此我们可以加个判断语句,来省掉多余的操作。

        subMergeSort(arr,l,mid);//归并排序前半段
subMergeSort(arr,mid+1,r);//归并排序后半段 //当arr[mid]<=arr[mid+1]时证明整个arr数组就已经有序了,那么此时根本不需要调用mergeSortCore方法
//只有当arr[mid]>arr[mid+1]时,我们才有必要执行mergeSortCore方法
if(arr[mid]>arr[mid+1]) //将两段有序序列归并成一段有序序列
mergeSortCore(arr,l,mid,r);

2)几乎对于所有的高级排序算法,有一种通用的优化,那就是在递归到底的情况下,可以使用直接插入排序进行优化。

当递归几乎到底时,每一组只有有限数量的元素,而元素越少,那么倾向于有序的几率越大。虽然直接插入排序的时间复杂度是O(n2),但是我们知道在元素趋向于有序时,它甚至可以高效运行使得时间复杂度达到O(n)。

同时,对于时间复杂度前面的系数大小,直接插入排序是比归并排序小的。

因此,当n小到一定程度,直接插入排序会比归并排序要快。

所以对于上面代码中实现归并排序的subMergeSort方法中的一个片段:

if(l>=r)
return;

改为:

if(r-l<=15){
insertionSort(arr,l,r);
return;
}

其中,insertionSort()方法是已经定义的实现闭区间直接插入排序的方法。

数字15也可以设置为其他数值。

从以上代码的执行过程来看,这是一种自上而下的归并排序算法。

对于自下而上的归并排序算法:


public static void mergeSortBtoU(int[] arr,int n){

        //自下而上的归并排序算法
//第一层循环对参与mergeSortCore的元素个数进行遍历,第一次为1个,第二次为2个,第三次为4个,第四次为8个。。。。
//从每一个单个元素开始作为归并小组进行归并,每一次归并成的结果是归并前原小组规模的二倍(即sz+=sz)
//当归并小组规模达到整个待排序数组大小的时候(即sz<=n),完成归并排序算法
for(int sz=1;sz<=n;sz+=sz)
//i为每一次进行mergeSortCore排序的元素的起始位置(每次进行两组元素的归并排序)
//每一次归并两组,每组的大小为sz,所以每次i的移动幅度为两个sz(即i+=sz+sz)
//用第二部分起始位置(i+sz)小于n,来限制每次归并时第二部分的存在,同时也保证了(i+sz-1)不会出现越界问题
for(int i=0;i+sz<n;i+=sz+sz)
//对arr[i...i+sz-1]和arr[i+sz...i+2*sz-1]进行归并
//对于将要进行归并的第二部分可能出现不足sz大小的情况,即(i+sz+sz-1可能出现越界问题)
//故用Math的min()方法进行限制
MergeSort.mergeSortCore(arr, i, i+sz-1, Math.min(i+sz+sz-1,n-1));
}

对此,也可进行优化操作。

另,对于自下而上的归并排序算法,没有使用数组中一个重要的性质:使用索引直接确定元素位置。因此,这种算法可以以时间复杂度为O(nlog2n)的速度对链表进行排序。