堆与堆排序/Heap&Heap sort

时间:2023-03-10 02:06:37
堆与堆排序/Heap&Heap sort

最近在自学算法导论,看到堆排序这一章,来做一下笔记。
堆排序是一种时间复杂度为O(lgn)的原址排序算法。它使用了一种叫做堆的数据结构。
堆排序具有空间原址性,即指任何时候都需要常数个额外的元素空间存储临时数据。

堆:
二叉堆是一个数组,它可以被看成一个近似的完全二叉树。
除了最底层以外,该树是满的;且最底层是从左向右填充。
堆又可以分为大根堆和小根堆。
大根堆:爸爸元素值>=儿子元素值
小根堆:爸爸元素值<=儿子元素值
可以把堆看成是一棵树,把堆的高度定义为根结点的高度。

建立一个堆包含建立堆(build_max_heap)和维护堆(max_heapify)两个操作。

维护堆(max_heapify):
由于大根堆具有根节点元素大于或等于孩子元素的特点。在输出堆顶或者堆排序的过程中,可能存在着大根堆“大根”性质被破坏的情况。这是就需要使用维护堆对大根堆进行“大根”性质的维护。
调用此函数传入一个数组arr与要调节位置的元素i 要求元素i的左右孩子都是大根堆
此时就可以用max_heapify通过让数组arr[i]的值在大根堆中逐步下降,使得下标为i的根结点所在的子树重新遵循大根堆的性质。
算法思想:
在(max_heapify)算法执行的过程中,每次从arr[i]、arr[left]、和arr[right]中选择一个最大的元素,将下标保存在largest中。并将arr[largest]与arr[i]的元素值进行交换。
若当前arr[i]为最大的元素,则程序结束。(由调用(max_heapify)的前提可以知道除了当前结点i以外,其左右子树必然符合大根堆的性质。)否则则递归调用(max_heapify(arr,largest,heap_size)继续对堆进行调整。
算法如下:

void max_heapify(int arr[],int i,int heap_size)//i为当前元素节点
{
int largest;
int left=*i;
int right=*i+;
if(left<=heap_size&&arr[left]>arr[i]) largest=left;
else largest=i;
if(right<=heap_size&&arr[right]>arr[largest])
largest=right;
if(largest!=i)
{
swap(arr[largest],arr[i]);
max_heapify(arr,largest,heap_size);
}
}

建立堆(build_max_heap):
在一个数组上建立堆可以自底向上地利用(max_heapify)来逐步调整数组,使其最后建成大根堆。
这里值得一提的是为什么要从n/2到1这样的顺序进行建堆。
从堆的性质我们可以知道,下标(n/2...n)的元素必然是叶子元素,而单个叶子元素也符合大根堆的性质。调用(max_heapify)的前提是当前i元素的子树得全是大根堆。所以建堆只能从下往上建。

void build_max_heap(int arr[],int length)
{
int heap_size=length;
for(int i=length/; i>=; i--)
{
max_heapify(arr,i,heap_size);
}
}

堆排序(heapsort):
堆排序是在堆的基础上进行的。
将大根堆进行排序,使数组升序排列的堆排序算法思想如下:
首先把根顶arr[1]与最后一个元素arr[n]进行交换,这样最大的元素便换到了最底
交换后heap_size减1
对余下的部分,由于交换了元素大根堆的性质遭到破坏。这时调用(max_heapify(arr,1,heap_size))对堆进行调整,使得最大的元素在最上
然后又交换根顶和最后一个元素(此时已是arr[1]与arr[n-1]),
heap_size减1,重复调用(max_heapify)来调整堆的性质……
就这样对下标为第n-1到2的元素进行调整。
最后即可将数组使数组呈升序排列。
具体算法如下:

void heapsort(int arr[],int length)
{
int heap_size=length;
build_max_heap(arr,length);
for(int i=length; i>=; i--)
{
swap(arr[],arr[i]);
heap_size--;
max_heapify(arr,,heap_size);
}
}

总代码如下:

#include<cstdlib>
#include<cstdio>
#include<iostream>
#include<algorithm>
using namespace std;
void max_heapify(int arr[],int i,int heap_size)//i为当前元素节点
{
int largest;
int left=*i;
int right=*i+;
if(left<=heap_size&&arr[left]>arr[i]) largest=left;
else largest=i;
if(right<=heap_size&&arr[right]>arr[largest])
largest=right;
if(largest!=i)
{
swap(arr[largest],arr[i]);
max_heapify(arr,largest,heap_size);
}
}
void build_max_heap(int arr[],int length)
{
int heap_size=length;
for(int i=length/; i>=; i--)
{
max_heapify(arr,i,heap_size);
}
}
void heapsort(int arr[],int length)
{
int heap_size=length;
build_max_heap(arr,length);
for(int i=length; i>=; i--)
{
swap(arr[],arr[i]);
heap_size--;
max_heapify(arr,,heap_size);
}
}
int main()
{
int arr[]= {,,,,,,,,,,};
int len=;
heapsort(arr,len);
cout<<"heapsort:\n";
for(int i=; i<=len; i++)
{
cout<<arr[i]<<' ';
}
cout<<endl;
return ;
}