hash_table和二叉搜索树都经常被用来构建符号表(或者字典)以及相关的结构,并且他们都表现出了很高的效率。最近也在不同的程序中使用了这两种数据结构,实现完毕后思考一下,对两者做了一个简单的比较:
1) 二叉搜索树是基于比较的原则实现,而hash_table则采用关键字索引的原则实现的。
2) hash_table的索引结构使得对元素的插入和查找独立于表结构大小,是一个常量时间,具有非常高的效率。但是二叉搜索树的结构也使得插入和查找的效率很高。
3) 由2)看似乎hash_table是符号表的最佳构建方式,但是hash_table也有自己的局限性。实际上hash_table是利用空间在换取时间,hash_table中可能使得一些空间被浪费掉(没有hash到该元素),并且表结构大小一开始就是固定的。另外对于hash函数的选择可能使得出现较多的冲突,影响了效率。不过,hash_table在时间和空间的平衡上还是比较突出的。
4) hash_table的另外一个局限性就是,不利于支持扩展的操作,例如排序。二叉搜索树中的中序遍历就可以得到全部元素的有序序列,而hash_table则不是很容易支持这种操作。再比如选择操作,在二叉搜索树中寻找第k大元素很容易实现,但在hash_table中则要求重新排序得到。
因此在具体应用的时候可以实际情况实际选择:)。
转自:k_eckel:Candidate for Master's Degree,School of Computer,Wuhan University,430079.