c# 图解泛型List<T>, HashTable和Dictionary<TKey,TValue>

前辈在代码中使用了HashTable，由于我用的比较少，不能理解，为什么不用Dictionary？看了源码以及查阅资料，总结如下：

首先看看它们的继承体系：

我把list<T>的继承体系也一并画出来，因为c#集合中List<T>和Dictionary<T>这两种数据结构实在太常用了。从上图中可以看到Dictionary和HashTable都继承于IDictionary。既然父辈都相同，那么注定会有很多相似的地方。那么它们又会有哪些不同呢？

这个还得研究源码，先看看HashTable：

  private struct bucket {

             public Object key;

             public Object val;

             public int hash_coll;   // Store hash code; sign bit means there was a collision.

         }

    private bucket[] buckets;

HashTable 定义了一个结构体数组，hash_coll里面存储了hash code。那么hash code又是什么东西呢？hash code其实类似于索引。还记得int[]，按顺序存储，我们必须知道它确切的存储位置，即在数组中的索引。在HashTable中，Key的类型是object，所以理论上可以是任意类型，但是我们实际上最常用的是Int和String类型。因此，HashTable是可以按字符串索引的。归根结底，微软扩展了数组，自定义了一个数组。这就带来了一个问题。什么问题？存储问题。以前的数组存储，我们按数字索引存储。现在呢，我们按key存储，如何按key存储？这就需要一个方法，把key映射到数组的不同位置上，并且不能重复。我们把这个映射方法称为散列函数GetHashCode。如果hash code出现重复了，我们称为哈希碰撞或者哈希冲突。产生冲突当然需要解决了。解决这一冲突的简单办法，便是不断地尝试其它位置，直到冲突解决。想想我们中午去饭店吃饭的时候，总要找个座位，这个座位必须是空的才行，如果发现这个座位有人，那么我们再去寻找其它的座位。如果所有的座位都满了，我们只能等待别人让出座位。程序若发现数组中的大部分位置都被占了，那么会扩展这个数组，否则会影响性能，总不能把时间花在找座位上。如下图所示：

c# 图解泛型List<T>, HashTable和Dictionary<TKey,TValue>

Dictionary的内部存储结构：

 private struct Entry {

             public int hashCode;    // Lower 31 bits of hash code, -1 if unused

             public int next;        // Index of next entry, -1 if last

             public TKey key;           // Key of entry

             public TValue value;         // Value of entry

         }

         private int[] buckets;

         private Entry[] entries;

从结构体的定义中，我们可以看出，Dictionary比HashTable多了一个next字段。那么这个next字段是做什么用的？

Dictionary处理哈希冲突的方法，是把具有相同的哈希值的元素放到一个逻辑链表里面。那么next字段正是指向下一个元素的索引。这种处理冲突的方法跟化学当中的同位素还是有点相似的。我们把不同的元素放到数组中，每个元素的同位素放到自己的逻辑链表里。具体如何实现，我们看源码：

  private void Insert(TKey key, TValue value, bool add) {

             if( key == null ) {

                 ThrowHelper.ThrowArgumentNullException(ExceptionArgument.key);

             }

             if (buckets == null) Initialize();

             int hashCode = comparer.GetHashCode(key) & 0x7FFFFFFF;

             int targetBucket = hashCode % buckets.Length;

             int index;

             if (freeCount > ) {

                 index = freeList;

                 freeList = entries[index].next;

                 freeCount--;

             }

             else {

                 if (count == entries.Length)

                 {

                     Resize();

                     targetBucket = hashCode % buckets.Length;

                 }

                 index = count;

                 count++;

             }

             entries[index].hashCode = hashCode;

             entries[index].next = buckets[targetBucket];

             entries[index].key = key;

             entries[index].value = value;

             buckets[targetBucket] = index;

             version++;