《编程珠玑》的第二部分讲的是性能,第三部分讲的是应用,所以我暂时跳过第二部分,直接看应用。
快速排序: 不稳定;时间复杂度O(nlogn)。
改进三:随机元素划分
第十一章 排序
排序问题一直是面试的热点!本章首先介绍了插入排序,然后介绍了快速排序,并提出了快速排序的几种改进方法,例如双向划分、随机数划分、以及小范围结合插入排序,三种的性能递增。
排序免不了交换,书中特别指出将swap()函数写入循环中会加速。
插入排序: 稳定,时间复杂度O(n^2),主要代码如下
for ( i = 1 ; i < n ; i ++ ) { t = x[i]; for( j = i ; j > 0 && x[j-1]>t;j--) x[j] = x[j-1]; x[j] = t; }
当出现n个相同元素组成的数组时,插入排序性能非常好,总运行时间为O(n),但qsort性能非常糟糕,因此提出改进。
改进二:采用双向划分的方法,代入如下:
void qsort3( l , u ) if l>=u return t = x[l]; i = l; j = u + l; loop do i++ while i<=u && x[i]<t //从左往右找到第一个大于等于t的数 do j-- while x[j]>t //从右往左找到第一风格小于等于t的数 if i > j break; swap( i , j ) swap( l , j) qsort3( l , j-1 ) qsort3( j+1 , u )
改进三:随机元素划分
改进四:快排+插入排序
第十二章 取样问题
本章主要介绍了生成0~n-1区间内m个随机数的三种方法,假设bigrand()函数返回一个随机大整数,例如C库函数rand()返回15位整数。
方法一:bigrand()%remaining<select,时间复杂度O(n)
方法二:C++zhongSTL的set集合,随机生成一个数,插入set中,最后有序输出。用空间换取时间,O(mlogn)
方法三:随机打乱一个数组,输出前m个即可,O(n+mlogn)
第十三章 搜索
本章介绍了5中表示随机整数集合的数据结构:有序数组、有序链表、二叉树、箱、位向量。各自性能如下:
集合表示 | 初始化操作 | insert操作 | 输出操作 | 总时间 | 空 间 |
有序数组 | 1 | m | m | O(m^2) | m |
有序链表 | 1 | m | m |
O(m^2)
|
2m |
二叉树 | 1 | logm | m |
O(mlogm)
|
3m |
箱 | m | 1 | m |
O(m)
|
3m |
位向量 | n | 1 | n |
O(n)
|
n/b |
有序数组 IntSetArr类 实现于 P129;
有序链表 IntSetList类 实现于 P130;
二叉树 IntSetBST类 实现于 P132;
位向量 IntSetBitVec类 实现于 P134;
箱 IntSetBins类 实现于 P135;
详细代码见《附录E》
本章的边栏介绍了“拼写检查器”的实现。
第十四章 堆
本章首先介绍了堆的性质:一是有序,二是形状,以及用数组来表示堆。
堆的两个关键函数是:siftup()自底向上,siftdown()自顶向下,代码分别实现于P144、P145。
优先级队列(插入和删除操作很频繁)是一种常见的数据结构,主要有三种实现方法:有序序列、无序序列、堆(介于前两者之间的折中方法),三者性能比较如下:
数据结构 | 一次insert时间 | 一次extract时间 | 两种操作各n次时间 |
有序序列 | O(n) | O(1) | O(n^2) |
堆 | O(logn) | O(logn) | O(nlogn) |
无序序列 | O(1) | O(n) | O(n^2) |
用堆实现优先级队列的代码在P147,建议动手实践!
最后介绍了堆排序算法,分两步进行:建堆+排序,O(nlogn),习题2,3对堆排序进行了改进,暂未明白。
堆排序代码:
for i = [2 , n) siftup(i) for( i = n ; i >= 2 ; i-- ) swap( l , i ) siftdown(i-1); //x[l]是前i个元素中最大的,将它和x[i]交换使得有序序列多一个元素,因此下移保持堆平衡
第十五章 字符串
本章主要介绍了三种字符串的应用:
1、生成词典,统计单词的个数,分别用C++和C实现。
C++实现使用了STL的set和map,其实本质是平衡搜索树。
C实现使用的是散列表,比C++速度更快。
2、最长重复字串,用后缀数组实现,O(nlogn),需要额外的n个指针空间。
3、生成随机文本,主要了解k阶文本-->k接马尔科夫链。