排序算法Java版,以及各自的复杂度,以及由堆排序产生的top K问题

时间:2022-10-14 08:59:31

常用的排序算法包括:

  • 冒泡排序
    每次在无序队列里将相邻两个数依次进行比较,将小数调换到前面, 逐次比较,直至将最大的数移到最后。最将剩下的N-1个数继续比较,将次大数移至倒数第二。依此规律,直至比较结束。时间复杂度:O(n^2)
  • 选择排序
    每次在无序队列中“选择”出最大值,放到有序队列的最后,并从无序队列中去除该值(具体实现略有区别)。时间复杂度:O(n^2)
  • 直接插入排序
    始终定义第一个元素为有序的,将元素逐个插入到有序排列之中,其特点是要不断的 移动数据,空出一个适当的位置,把待插入的元素放到里面去。时间复杂度:O(n^2)
  • 希尔排序:
    希尔排序是对直接插入排序的改进,希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。
  • 快速排序
    递归地将数组一分为2,左边是所有比第一个数小的,右边是所有比第一个数大的。这其中涉及到如何移动交换的技巧问题。本题为挖坑填坑模式。时间复杂度:O(nlogn)
  • 堆排序
    对需要排序的数组首先建立堆,然后(如果最终是由小到大排序)依次交换根位置与最后一个节点位置的数值,之后调整堆,循环往复。时间复杂度:O(nlogn)。关于堆这一数据结构以及堆排序可以参考百度百科:堆排序
  • 归并排序:给定两个已经排好序(由小到大)的数组,归并排序的意思是,选取数组A中的第一个值,与另一个数组B中的第一个值比较,每找到一个较小的值就写入新的数组C,直到所有的值都大于此值时,将此值写入C,选取数组A的一个值作为对照值,重复上面的操作。时间复杂度:O(nlogn)

关于:各种排序算法时间复杂度和空间复杂度表

关于各种排序算法的稳定性

1) 稳定的:如果存在多个具有相同排序码的记录,经过排序后,这些记录的相对次序仍然保持不变,则这种排序算法称为稳定的。
    插入排序、冒泡排序、归并排序、分配排序(桶式、基数)都是稳定的排序算法。
 2) 不稳定的:否则称为不稳定的。
    直接选择排序、堆排序、shell排序、快速排序都是不稳定的排序算法。

关于不同引用场景下使用不同的算法:

(1) 若n较小(如n≤50),可采用直接插入或直接选择排序。
     当记录规模较小时,直接插入排序较好;否则因为直接选择移动的记录数少于直接插人,应选直接选择排序为宜。
(2) 若文件初始状态基本有序(指正序),则应选用直接插人、冒泡或随机的快速排序为宜;
(3) 若n较大,则应采用时间复杂度为O(nlgn)的排序方法:快速排序、堆排序或归并排序。
     快速排序是目前基于比较的内部排序中被认为是最好的方法,当待排序的关键字是随机分布时,快速排序的平均时间最短;
     堆排序所需的辅助空间少于快速排序,并且不会出现快速排序可能出现的最坏情况。这两种排序都是不稳定的。
     若要求排序稳定,则可选用归并排序。但本章介绍的从单个记录起进行两两归并的  排序算法并不值得提倡,通常可以将它和直接插入排序结合在一起使用。先利用直接插入排序求得较长的有序子文件,然后再两两归并之。因为直接插入排序是稳定 的,所以改进后的归并排序仍是稳定的。

补充:视觉直观感受 7 种常用的排序算法

代码1:冒泡排序,选择排序,直接插入排序,希尔排序,快速排序代码。

 /**
* 冒泡排序: 每次在无序队列里将相邻两个数依次进行比较,将小数调换到前面, 逐次比较,直至将最大的数移到最后。
* 最将剩下的N-1个数继续比较,将次大数移至倒数第二位。 依此规律,直至比较结束。
*/
public static void bubbleSort(int[] a) {
int n = a.length;
for (int i = 0; i < n - 1; i++) {
for (int j = 0; j < n - i - 1; j++) {
if (a[j] > a[j + 1]) {
int temp = a[j + 1];
a[j + 1] = a[j];
a[j] = temp;
}
}
}
} /**
* 选择排序:每次在无序队列中“选择”出最大值,放到有序队列的最后,并从无序队列 中去除该值(具体实现略有区别)。
*/
public static void selectSort(int[] a) {
int n = a.length;
int max_index = 0;
for (int i = n - 1; i >= 0; i--) {
max_index = i;
for (int j = 0; j <= i; j++) {
if (a[j] > a[max_index])
max_index = j;
}
if (max_index != i) {
int temp = a[i];
a[i] = a[max_index];
a[max_index] = temp;
}
}
} /**
* 插入排序:始终定义第一个元素为有序的,将元素逐个插入到有序排列之中,其特点是要不断的 移动数据,空出一个适当的位置,把待插入的元素放到里面去。
*/
public static void insertSort(int[] a) {
int n = a.length;
int j = 0;
for (int i = 1; i < n; i++) {
j = i - 1;
int temp = a[i];
while (j >= 0 && a[j] > temp) {
a[j + 1] = a[j];
j--;
}
a[j + 1] = temp;
for (int m : a) {
System.out.print(m + ",");
}
System.out.println();
// for (int j = i; j > 0; j--) {
// if (a[j] < a[j - 1]) {
// int temp = a[j];
// a[j] = a[j - 1];
// a[j - 1] = temp;
// }
// }
}
} /**
* 快速排序:递归地将数组一分为2,左边是所有比第一个数小的,右边是所有比第一个数大的
*/
public static void quickSort(int[] a) {
quickSort(a, 0, a.length - 1);
} private static void quickSort(int[] a, int l, int r) {
if (l < r) {
// 取左边第一个值作为分界值
int mid = a[l];
int i = l, j = r;
while (i < j) {
while (i < j && a[j] > mid)
j--;
if (i < j)
a[i++] = a[j];
while (i < j && a[i] <= mid)
i++;
if (i < j)
a[j--] = a[i];
}
a[i] = mid;
quickSort(a, l, i - 1);
quickSort(a, i + 1, r);
}
} /**
* 希尔排序是对直接插入排序的改进,希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,
* 当增量减至1时,整个文件恰被分成一组,算法便终止。
*
* @param a
*/
public static void shellSort(int[] a) {
int d = a.length;
while (true) {
d = d / 2;
for (int x = 0; x < d; x++) {// 分组
// 对每组进行直接插入排序
for (int i = x + d; i < a.length; i = i + d) {
int temp = a[i];// 记录要插入的值
int j;
// 将要插入的值插入到正确位置,这一过程中不断检测前面的数,如果相比较大,则同时移动一次
for (j = i - d; j >= 0 && a[j] > temp; j = j - d) {
a[j + d] = a[j];
}
a[j + d] = temp;
}
}
if (d == 1) {
break;
}
}
}

代码2:推排序(由于java版比较长,所以另写一个)

 public class HeapSort {
private static int[] sort = new int[] { 1, 0, 10, 20, 3, 5, 6, 4, 9, 8, 12, 17, 34, 11 }; public static void main(String[] args) {
System.out.println(sort.length);
buildMaxHeapify(sort);
heapSort(sort);
print(sort);
} private static void buildMaxHeapify(int[] data) {
// 没有子节点的才需要创建最大堆,从最后一个的父节点开始
int startIndex = getParentIndex(data.length - 1);
// 从尾端开始创建最大堆,每次都是正确的堆
for (int i = startIndex; i >= 0; i--) {
maxHeapify(data, data.length, i);
}
} /**
* 创建最大堆
*
* @paramdata
* @paramheapSize需要创建最大堆的大小,一般在sort的时候用到,因为最多值放在末尾,末尾就不再归入最大堆了
* @paramindex当前需要创建最大堆的位置
*/
private static void maxHeapify(int[] data, int heapSize, int index) {
// 当前点与左右子节点比较
int left = getChildLeftIndex(index);
int right = getChildRightIndex(index); int largest = index;
if (left < heapSize && data[index] < data[left]) {
largest = left;
}
if (right < heapSize && data[largest] < data[right]) {
largest = right;
}
// 得到最大值后可能需要交换,如果交换了,其子节点可能就不是最大堆了,需要重新调整
if (largest != index) {
int temp = data[index];
data[index] = data[largest];
data[largest] = temp;
maxHeapify(data, heapSize, largest);
}
} /**
* 排序,最大值放在末尾,data虽然是最大堆,在排序后就成了递增的
*
* @paramdata
*/
private static void heapSort(int[] data) {
// 末尾与头交换,交换后调整最大堆
for (int i = data.length - 1; i > 0; i--) {
int temp = data[0];
data[0] = data[i];
data[i] = temp;
maxHeapify(data, i, 0);
}
} /**
* 父节点位置
*
* @paramcurrent
* @return
*/
private static int getParentIndex(int current) {
return (current - 1) >> 1;
} /**
* 左子节点position注意括号,加法优先级更高
*
* @paramcurrent
* @return
*/
private static int getChildLeftIndex(int current) {
return (current << 1) + 1;
} /**
* 右子节点position
*
* @paramcurrent
* @return
*/
private static int getChildRightIndex(int current) {
return (current << 1) + 2;
} private static void print(int[] data) {
int pre = -2;
for (int i = 0; i < data.length; i++) {
if (pre < (int) getLog(i + 1)) {
pre = (int) getLog(i + 1);
System.out.println();
}
System.out.print(data[i] + "|");
}
} /**
* 以2为底的对数
*
* @paramparam
* @return
*/
private static double getLog(double param) {
return Math.log(param) / Math.log(2);
}
}

代码3:top-K问题

 /**
* 使用最大堆进行top K的选取
*/
public static int[] topK(int[] a, int k) {
int[] res = new int[k];
if (k > a.length) {
System.err.println("k larger than length of array");
return res;
}
for (int i = 0; i < a.length; i++) {
if (a[i] > res[0]) {
res[0] = a[i];
for (int j = 0; j < k && 2 * j + 1 < k;) {
int tag1 = 0, tag2 = 0;
if (2 * j + 2 < k && res[2 * j + 1] > res[2 * j + 2]) {
if (res[j] > res[2 * j + 2]) {
int temp = res[2 * j + 2];
res[2 * j + 2] = res[j];
res[j] = temp;
j = 2 * j + 2;
tag1 = 1;
}
} else {
if (res[j] > res[2 * j + 1]) {
int temp = res[2 * j + 1];
res[2 * j + 1] = res[j];
res[j] = temp;
j = 2 * j + 1;
tag2 = 1;
}
}
if (tag1 == 0 && tag2 == 0)
break;
}
}
}
return res;
}