文章目录
- 排序
- 性能分析
排序
ref
排序的对象
- 排序对象是:记录(也叫元素)的序列
- 每个记录都含有若干个字段,对于排序而言,最重要的是其中的关键字字段
- 当记录最简单化,就是数值排序(比如实数排序/整数排序)
排序分类
- 内部排序
- 排序元素全部载入内存进行排序
- 外部排序
- 被排序元素在排序过程中,需要在内,外存间移动
排序算法的稳定性SortAlgorithmStability
- 待排序列具有前后关系,且
- 如果排序算法排序后,仍然有前面,则该排序算法稳定
性能分析
比较排序算法的性能分析原则
- 比较排序算法性能(时空复杂度)主要是取决于比较和移动的次数
基于比较的排序算法的比较次数
决策树(desicion tree)
- 因为任何正确的排序算法都能够生成输入的每一个排列
- 所以对一个正确的比较排序算法来说:
- 个元素的种可能的排列都应该出现在决策树的叶结点上。
- 给定任意一个待排序序列,经过某一个比较排序算法处理,得到排序完的结果序列
- 假设这个排序过程中发生的元素间调整操作的序列SOS(sort operation serials)
- 含有n个元素的待排序序列可能有n!中序列
- 这些序列在同一个排序算法对应不同的操作序列(操作序列的长度也可能不等长)
- 有的序列规律性强(例如最好的情况),需要的操作步骤少,有的则相反(最坏的情况)
- 最坏的情况对应于排序树从根结点到叶子结点的最长的一条路径(主要研究最坏的情况)
- 不同的待排序序列对应到了不同叶结点
- 因此叶子结点至少有n!个
- 由这个约束,我们可以确定比较排序的决策树的高度下限
- 而且,(每一个叶结点都必须是可以从根结点经由某条路径到达的,该路径对应于比较排序的一次实际执行过程(我们称这种叶结点为“可达的”)。
- 因此,我们只考虑(每一种排列都是一个可达的叶结点的决策树)。
- 上述输入序列的元素序列:6,8,5
- 根据插入排序算法构建的插入排序决策树
- 排序目标时升序排列
- 最坏的情况下需要从根结点比较到最长路径的叶子结点
- 例如上例中的粗线路径(插入排序比较过程)
- 从
- 最好的能够确定全序列有序情况是:
- 因为,上述两个比较足以确定下来
决策树分析
- 在最坏情况下,任何比较排序算法都需要做次比较。
- 证明︰根据前面的讨论,对于一棵每个排列都是一个可达的叶结点的决策树来说,树的高度完全可以被确定。
- 因为输入数据的种可能的排列都是叶结点,所以有。
- 由于在一棵高为h的二叉树中,叶结点的数目不多于,如果根结点所在高度为0,则叶结点数上限为
- 我们得到的取值确界:
- 对该式两边取对数,有
渐近最优的比较排序算法
- 堆排序和归并排序都是渐近最优的比较排序算法。
- 堆排序和归并排序的运行时间上界为O()
判断给定序列的有序性(数值序列)
- 有序序列包括顺序和逆序
- 一个简单的思路是,但发现任意三个元素中是无序的,则整个序列无序
- 对于无序序列往往不需要扫描完整个序列就可以判定无序
- 不超过n-1次
- 对于序列,则必须至少比较n-1次才可以确定是有序的
- 但也不超过n-1次
总结