算法-排序算法总结

时间:2022-01-24 09:49:21
void print_arr(int array[],int length)
{
    for (int i=0;i<length;i++)
    {
        cout<<array[i]<<' ';
    }
    cout<<endl;
}
void swap(int array[],int i,int j)
{
    int temp=array[i];
    array[i] = array[j];
    array[j] = temp;
}

冒泡排序

朴素冒泡排序

反复扫描待排序序列,在扫描的过程中顺次比较相邻的两个元素的大小,若逆序就交换位置。第一趟,从第一个数据开始,比较相邻的两个数据,(以升序为例)总是把大的数交换到后面,得到一个最大数据在末尾;然后进行第二趟,只扫描前n-1个元素,得到次大的放在倒数第二位。以此类推,最后得到升序序列。
当然也可以从最后一个数开始向前扫描,此时要把较小的数换到前面,得到一个最小的数在最前面;然后进行第二趟,只扫描后n-1个元素,得到次小的放在第二位。以此类推,得到升序序列。
无论是找最大还是找最小,冒泡排序都是一个数从底部逐位移到顶部,就像气泡一样,这也就是冒泡排序的名字由来。

void BubbleSort_simple(int array[], int length)
{
    int temp;       //保存临时数据(数据交换时使用)
    for(int i = 0; i < length-1; i++)//设置需要扫描的趟数
    {  
        for(int j = 0; j < length - i - 1; j++) //遍历,比相邻两个数据的大小
        {   
            if(array[j] > array[j+1])
            {
                temp = array[j+1];
                array[j+1] = array[j];
                array[j] = temp;
            }
        }
    }
}

改进冒泡排序

对于朴素冒泡排序算法,永远在进行从从n-1到1扫描过程,哪怕中间某次的时候,顺序就已经排好了(不再有交换),所以可以根据这点对冒泡排序作出改进,的如果在某次扫描过程中,发现没有交换,说明已经排好序列,直接终止扫描。所以最多进行n-1趟扫描,最少只需要1趟。

void BubbleSort_Improve(int array[], int length)
{
    int temp;       //保存临时数据(数据交换时使用)
    bool flag = true;       //设置标记,记录此趟排序是否发生交换
    for(int i = 0; i < length-1&&flag; i++)//设置需要扫描的趟数
    {  
        flag = false;
        for(int j = 0; j < length - i - 1; j++) //遍历,比相邻两个数据的大小
        {   
            if(array[j] > array[j+1])
            {
                temp = array[j+1];
                array[j+1] = array[j];
                array[j] = temp;

                flag = true;
            }
        }
    }
}

稳定性与复杂度分析

时间复杂度:
对于朴素冒泡排序算法,没有最好与最差情况的区别,时间复杂度都是O(n^2),对于改进冒泡排序算法,最好的情况是本来有序,此时时间复杂度为O(n),最差的情况是逆序,此时时间复杂度为O(n^2)。
空间复杂度:
冒泡排序只需要一个临时位置做交换数据,所以空间复杂度O(1)。
稳定性:
稳定

选择排序

冒泡排序存在大量的逐位交换操作,最后把小的数换到最前,而简单选择排序算法就是为了解决频繁交换的问题(虽然这对时间复杂度计算没有影响,但是交换操作实际上在影响着效率)。
选择排序,或者叫简单选择排序(因为堆排序也是一种选择排序),简单选择排序有两个索引,一个是要把最小的值交换到的位置i,一个是找到的最小值位置min,其中i是随着遍历逐步加1的,而每一次的过程中都用i初始化min,并遍历i后的所有个位置逐个与min比较,最终从中找到min的位置后与i交换,i++后重复上述过程,直到遍历结束。

void SelectSort(int array[], int length)
{
    int min;  //保存目标元素的索引
    int temp; //临时变量(数据交换时候使用)
    for(int i = 0; i < length; i++)//对数组中的每一个数进行遍历
    {    
        min = i;
        for(int j = i+1; j < length; j++)//选择出目前最小元素的索引
        {
            if(array[min] > array[j])
                min = j;
        }

        if(min != i)
        {
            temp = array[i];
            array[i] = array[min];
            array[min] = temp;
        }
    }
}

稳定性与复杂度分析

时间复杂度:
简单选择排序为了解决频繁交换问题,相比于(改进冒泡排序)在时间复杂度上没有改进,其实反而更差一些,因为简单选择排序在时间复杂度上没有最好与最坏的区别,都是O(n^2),但是比较好的一点是,即便是最差的情况,简单选择排序的交换次数也只有n-1次。
空间复杂度:
O(1)
稳定性:
不稳定

插入排序

这里的插入排序指的是直接插入排序算法,基本思想就是认为前i-1个数的顺序已经排好,将第i个值插入到前i-1个中的适当位置。所以i是从数组中第二个数开始一直到最后,每次插入前都保存好array[i]的值,并对前i-1个数的位置做出调整,最后将array[i]插入到合适的位置。

void InsertSort(int array[],int length)
{
    int temp;   //保存插入值
    int j;      //记录与插入值比较的索引
    for(int i = 1;i < length;i++)
    {
        temp = array[i];
        j = i-1;
        while(j >= 0 && array[j] > temp )
        {
            array[j+1] = array[j];
            j = j - 1;
        }
        array[j+1] = temp;
    }
}

稳定性与复杂度分析

时间复杂度:
最好的情况(本身有序),时间复杂度O(n);最差的情况(本身逆序),时间复杂度O(n^2),平均时间复杂度(n^2)。
空间复杂度:
O(1)
稳定性:
稳定

希尔排序

希尔排序是第一个突破排序时间复杂度O(n^2)d的算法,又称缩小增量排序法。基本思想是使用跃进的方式,把待排序序列分成若干较小的子序列,然后逐个使用直接插入排序法排序,最后再对一个较为有序的序列进行一次排序,主要是为了减少移动的次数,提高效率。原理应该就是从无序到渐渐有序,要比直接从无序到有序移动的次数会少一些。
希尔排序比较难理解的地方也是它的跃进式方式,在最外层的循环(do-while)中,是在改变跃进的步长,最后一次的跃进步长一定为1,也就是两两交换。第二层循环(第一个for)实现以某一次的step遍历所有数,而for之内的操作其实就是一个直接插入排序。

void ShellSort(int array[], int length)
{
    int i,j,k=0;
    int temp;   //保存临时数据(数据交换时使用)
    int step=length;   //设置增量
    do 
    {
        step = step/3;      
        for( i = step; i < length; i++)
        {   
                if(array[i] < array[i-step])//直接插入排序
                {
                    temp = array[i];
                    for(j=i-step;j>=0&& array[j] > temp;j-=step)
                        array[j + step] = array[j];
                    array[j + step] = temp;
                }
            }
            cout<<++k<<"次希尔排序结果:"<<endl;
            print_arr(array,length);
        }
    while (step>1);
}

稳定性与复杂度分析

时间复杂度:
最好的情况(本身有序),时间复杂度O(n^1.3);最差的情况(本身逆序),时间复杂度O(n^2),平均时间复杂度(n^1.5)。
空间复杂度:
O(1)
稳定性:
不稳定

快速排序

快速排序是一个递归的过程,递归的部分一般称为Partition,即在一个序列中选取一个数字n,把序列中小于等于n的数字放在n的左边,大于n的数字放在n 的右边,即完成了一次Partition。其具体的实现为:
比如一个数列arr为:{4,7,8,9,5,6,1,3,2},那么我们可以直接把arr[0]位置的数作为分割数,即n=4,那么下面的工作就是如何把数列中小于等于4的数放在4的左边,大于等于4的数放在4的右边。首先找到右侧第一个小于等于4的数,与4所在的位置交换:
2 7 8 9 5 6 1 3 4
找到左侧第一个大于等于4的数,与4交换:
2 4 8 9 5 6 1 3 7
找到右侧第一个小于等于4的数,与4交换:
2 3 8 9 5 6 1 4 7
找到左侧第一个大于等于4的数,与4交换:
2 3 4 9 5 6 1 8 7
一直重复上述过程,直到右侧大于等于4的数与左侧小于等于4的数是一个数(一个位置),也就是4本身所在的位置,就完成了一次Partition:
2 3 1 9 5 6 4 8 7
2 3 1 4 5 6 9 8 7
2 3 1 4 5 6 9 8 7
2 3 1 4 5 6 9 8 7

以上就是快速排序算法的基础组成,而快排就是不断递归Partition的过程。

int Partition(int array[],int low,int high)
{
    int pv=0;
    pv =array[low];
    while(low<high)
    {
        while((low<high)&&(array[high]>=pv))
            high--;
        swap(array,high,low);
        while((low<high)&&array[low]<=pv)
            low++;
        swap(array,low,high);
    }
    return low;
}
void QSort(int array[],int low,int high)
{
    int pvIndex = 0;
    if (low>=high)
    {
        return;
    }
    pvIndex = Partition(array,low,high);
    QSort(array,low,pvIndex-1);
    QSort(array,pvIndex+1,high);
}
void QuickSort(int array[],int length)
{
    QSort(array,0,length-1);
}

稳定性与复杂度分析

时间复杂度:
最好的情况(本身有序),时间复杂度O(nlogn);最差的情况(本身逆序),时间复杂度O(n^2),平均时间复杂度(nlogn)。
空间复杂度:
O(nlogn)
稳定性:
不稳定

归并排序

归并排序是建立在二路归并和分治法的基础上的一个高效排序算法,将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
将待排序序列R[0…n-1]看成是n个长度为1的有序序列,将相邻的有序表成对归并,得到n/2个长度为2的有序表;将这些有序序列再次归并,得到n/4个长度为4的有序序列;如此反复进行下去,最后得到一个长度为n的有序序列。
算法-排序算法总结
所以就像快速排序的Partition功能一样,归并排序也有一个基础的组成部分,就是合并的过程,我们可以将它称为Merge,其思路为:比较二个数列的第一个数,谁小就先取谁,取了后就在对应数列中删除这个数。然后再进行比较,如果有数列为空,那直接将另一个数列的数据依次取出即可。

void Merge(int array[],int left,int mid,int right)
{
    int lstart=left;
    int rstart = mid+1;
    int index = 0;
    int *temp = new  int[right-left+1];
    while (lstart<=mid&&rstart<=right)
    {
        if(array[lstart]<=array[rstart])
            temp[index++]=array[lstart++];
        else
            temp[index++]=array[rstart++];
    }
    while (lstart<=mid)
    {
        temp[index++]=array[lstart++];
    }
    while (rstart<=right)
    {
        temp[index++]=array[rstart++];
    }
    for(int i = 0; i < index; i++)
        array[left+i] = temp[i];
    delete[] temp;
    temp = nullptr;
}
void MSort(int array[],int left,int right)
{
         if(left == right) return;
        int mid = (left+right)/2;
        MSort(array,left,mid);
        MSort(array,mid+1,right);
        Merge(array,left,mid,right);
}
void MergeSort(int array[],int length)
{
    MSort(array,0,length-1);
}

稳定性与复杂度分析

时间复杂度:
最好的情况(本身有序),时间复杂度O(nlogn);最差的情况(本身逆序),时间复杂度O(nlogn),平均时间复杂度(nlogn)。
空间复杂度:
在所有的常见排序算法中,归并排序的空间复杂度最高,因为他需要一个和待排序数列相同长度的空间去做拆分和合并,所以空间复杂度为:O(n)
稳定性:
稳定
归并排序也是快排,堆排序,归并排序三种算法中唯一稳定的一个。

堆排序

堆排序是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。所以在理解堆排序之前,要了解堆的概念:
堆分为大根堆和小根堆,是完全二叉树。大根堆的要求是每个节点的值都不大于其父节点的值,即A[PARENT[i]] >= A[i]。所以根据大根堆的要求可知,最大的值一定在堆顶。与最大堆对应的就是最小堆了,最小堆的要求是每一个节点的值都不小于其父结点的值。堆一般用数组的形式实现,下面就是最大堆与最小堆的存储结构:
算法-排序算法总结
可以看到,i结点的父结点下标就为(i – 1) / 2(/符号是取整符号,不是除法!!不是除法!!)。它的左右子结点下标分别为2 * i + 1和2 * i + 2。如第0个结点左右子结点下标分别为1和2。比如最大数组中,i=3位置的值为25,那么其父结点为i=1位置,在最大堆中也就是56;i=3结点的左右孩子是i=7和i-8,显然没有。
那么清楚了最大堆与其顺序存储形式后,就可以看下堆排序算法了(假设使用最大堆),那么首先将无序的数组构建成一个最大堆的形式,此时堆顶的元素值一定是最大的,随后移除该值,重新调整成最大堆,重复移除与调整的过程,直到只剩下最后一个结点。

void HeapAdjust(int array[],int parent,int length)
{
    int temp =array[parent];
    for(int child = parent*2+1;child<length;child = child*2+1)
    {
        if(child+1<length&&array[child]<array[child+1])
            child++;
        if(temp>=array[child])
            break;
        array[parent] = array[child];
        parent = child;
    }
    array[parent] = temp;
}
void HeapSort(int array[],int length)
{
    int i;
    for(i=length/2-1;i>=0;i--)
     HeapAdjust(array,i,length-1);
    for (i = length-1;i>0;i--)
    {
        swap(array,0,i);
        HeapAdjust(array,0,i);
    }
}

稳定性与复杂度分析

时间复杂度:
最好的情况(本身有序),时间复杂度O(nlogn);最差的情况(本身逆序),时间复杂度O(nlogn),平均时间复杂度(nlogn)。
空间复杂度:
O(1)
稳定性:
不稳定

总结

算法-排序算法总结

所有排序算法中用的最多的是堆排序,快速排序与归并排序,在这三种算法中:
如果从空间复杂度来考虑的话,首选堆排序,其次是快速排序,最后是归并排序。
如果从稳定性考虑,选择归并排序(稳定)。

此外,还有一种说法,如果待排序列表基本有序,那么选择直接插入排序。

在以上的7中排序算法中,也可以按照主要操作进行分类,可以分为4类:

基于交换:冒泡排序,快速排序
基于选择:简单选择排序,堆排序
基于插入:直接插入排序,希尔排序
基于归并:归并排序

在最后,不知道大家有没有发现一个问题,堆排序与快排的空间复杂度,平均时间复杂度与最好情况下时间复杂度都一样,但是最差情况下时间复杂度堆排序要更胜一筹,那么为毛快排更好呢?直接贴出解答地址吧,我也是从这看的:数学之美番外篇:快排为什么那样快