HashMap源码解析非原创

Stack过时的类，使用Deque重新实现。

HashCode和equals的关系

HashCode为hash码，用于散列数组中的存储时HashMap进行散列映射。

equals方法适用于比较两个对象是否相同，Object方法的equals方法默认为比较两个对象的地址是否相同

    public boolean equals(Object obj) {

        return (this == obj);

    }

在实际开发中hashcode()和equals()都需要自己重写并且需要保证一下原则

两个对象equals()，那么这两个对象的hashcode()一定相等
两个对象hashcode相等，其不一定equals()，因为hashcode函数仅仅是做分散，最终还是会发生一定的冲突

可以考虑在集合中，判断两个对象是否相等的规则是：

　　　　第一步，如果hashCode()相等，则查看第二步，否则不相等;

　　　　第二步，查看equals()是否相等，如果相等，则两obj相等，否则还是不相等。

public static void main(String[] args) {

        Object o1 = new Object();

        Object o2 = new Object();

        System.out.println("hashcode o1 :"+o1.hashCode());

        System.out.println("hashcode o2 :"+o2.hashCode());

        System.out.println("o1 equals o2 ?"+o1.equals(o2));

    }

hashcode o1 :1826771953

hashcode o2 :1406718218

o1 equals o2 ?false

HashMap源码解析：

HashMap的定义：

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

继承抽象AbstractMap，实现了Map。

HashMap中重要常量：

//默认容量

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;

//最大容量

static final int MAXIMUM_CAPACITY = 1 << 30;

//默认加载因子

static final float DEFAULT_LOAD_FACTOR = 0.75f;

//链表转成红黑树的阈值

static final int TREEIFY_THRESHOLD = 8;

//红黑树转为链表的阈值

static final int UNTREEIFY_THRESHOLD = 6;

//存储方式由链表转成红黑树的容量的最小阈值

static final int MIN_TREEIFY_CAPACITY = 64;

//HashMap中存储的键值对的数量

transient int size;

//扩容阈值，当size>=threshold时，就会扩容

int threshold;

//HashMap的加载因子

final float loadFactor;

需要指出的是这里loadFactor加载因子在初始化后就不能变更。加载因子也可以叫做扩充因子----毕竟只是拿来判断是否扩容的嘛(#^.#)。

初始化HashMap

Map<K,V> map = new HashMap<K,V>();

或者 Map<K,V> map = new HashMap<K,V>(31)

实际调用的代码

public HashMap(int initialCapacity) {

    this(initialCapacity, DEFAULT_LOAD_FACTOR);

}

this(initialCapacity,DEAULT_LOAD_FACTOR);

public HashMap(int initialCapacity, float loadFactor) {

    if (initialCapacity < 0)

        throw new IllegalArgumentException("Illegal initial capacity: " +

                                           initialCapacity);

    if (initialCapacity > MAXIMUM_CAPACITY)

        initialCapacity = MAXIMUM_CAPACITY;

    if (loadFactor <= 0 || Float.isNaN(loadFactor))

        throw new IllegalArgumentException("Illegal load factor: " +

                                           loadFactor);

    this.loadFactor = loadFactor;

    this.threshold = tableSizeFor(initialCapacity);

}

在初始化中会判断，初始化参数是否小于0，抛出IllegalArgumentException();如果HashMap的最大容量MAXIMUM_CAPACITY(也就是2的32次方，为什么是2的32次方呢？ )，在确定threhold扩容阈值。

细心的同学可能注意到HashMap中所有常量的定义都是int型，Java中int型是32位的。

接下来就是对tableSizeFor的解释：

/**

 * Returns a power of two size for the given target capacity.

 */

static final int tableSizeFor(int cap) {

    int n = cap - 1;

    n |= n >>> 1;

    n |= n >>> 2;

    n |= n >>> 4;

    n |= n >>> 8;

    n |= n >>> 16;

    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;

}

源代码中注释的写的是获取与cap最相近的2的幂。

例如 32 会产生32 而33就会产生64，这个式子很神奇，为什么正确，我也不太明了o(╥﹏╥)o。

Hash()方法

static final int hash(Object key) {

    int h;

    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

}

^是异或操作 1^1 =0 ;1^0 = 1; 0^1 =1 ;0^0=0; 多位的异或，比如3^2 = 1 (11^10 = 01);

这里需要解释的是，如果(h = key.hashCode())^(h>>>16) 是取h的低16位与高16为进行异或作为低16位与h的高16位进行拼接，得到最后的hash值。据说能够提高hash的分散程度。嘤嘤嘤。

还有提到一点就是HashSet内部是使用HashMap实现的；这个在解析HashSet的时候会详细提到；
/**

	HashSet的Add的方法

*/

public boolean add(E e) {

 return map.put(e, PRESENT)==null;

}

HashSet核心方法

putVal()方法

源码：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

               boolean evict) {

    Node<K,V>[] tab; Node<K,V> p; int n, i;

    if ((tab = table) == null || (n = tab.length) == 0)

        n = (tab = resize()).length;

    if ((p = tab[i = (n - 1) & hash]) == null)

        tab[i] = newNode(hash, key, value, null);

    else {

        Node<K,V> e; K k;

        if (p.hash == hash &&

            ((k = p.key) == key || (key != null && key.equals(k))))

            e = p;

        else if (p instanceof TreeNode)

            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

        else {

            for (int binCount = 0; ; ++binCount) {

                if ((e = p.next) == null) {

                    p.next = newNode(hash, key, value, null);

                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

                        treeifyBin(tab, hash);

                    break;

                }

                if (e.hash == hash &&

                    ((k = e.key) == key || (key != null && key.equals(k))))

                    break;

                p = e;

            }

        }

        if (e != null) { // existing mapping for key

            V oldValue = e.value;

            if (!onlyIfAbsent || oldValue == null)

                e.value = value;

            afterNodeAccess(e);

            return oldValue;

        }

    }

    ++modCount;

    if (++size > threshold)

        resize();

    afterNodeInsertion(evict);

    return null;

}

我们慢慢来分析。首先看入参：

hash：表示key的hash值

key：待存储的key值

value：待存储的value值，从这个方法可以知道，HashMap底层存储的是key-value的键值对，不只是存储了value

onlyIfAbsent：这个参数表示，是否需要替换相同的value值，如果为true，表示不替换已经存在的value

evict：如果为false，表示数组是新增模式

我们看到put时所传入的参数put(hash(key), key, value, false, true)，可以得到相应的含义。

作者：端木轩

链接：https://www.jianshu.com/p/7dcff1fd05ad

來源：简书

简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

HashMap中的数据结构

在继续下一步分析之前，我们首先需要看一下HashMap底层的数据结构。

HashMap的数据结构

我们可以看到，HashMap底层是数组加单向链表或红黑树实现的(这是JDK 1.8里面的内容，之前的版本纯粹是数组加单向链表实现)。

回到最骚气的putVal()

Node<K,V>[] tab; Node<K,V> p; int n, i;

Node<K,V>[] tab 用于引用table也就是hash表；

Node<K,V> p 用于指向需要指向红黑树或者链表；

int n 用于存储当前table的长度；

int i 用于存储当前访问的table索引；

if ((tab = table) == null || (n = tab.length) == 0)

    n = (tab = resize()).length;

如果表为空或这表的长度为零重新分配表；

if ((p = tab[i = (n - 1) & hash]) == null)

    tab[i] = newNode(hash, key, value, null);

如果当前访问的桶为空，初始化一个新的节点

Node<K,V> e; K k;

if (p.hash == hash &&

    ((k = p.key) == key || (key != null && key.equals(k))))

    e = p;

当前的hash值等于。。。

else if (p instanceof TreeNode)

    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

当前访问的桶是红黑树，将该值放入红黑树中；

for (int binCount = 0; ; ++binCount) {

    if ((e = p.next) == null) {

        p.next = newNode(hash, key, value, null);

        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

            treeifyBin(tab, hash);

        break;

    }

    if (e.hash == hash &&

        ((k = e.key) == key || (key != null && key.equals(k))))

        break;

    p = e;

}

如果桶是空的，将节点添加到链表后面，如果当前链表长度大于TREEIFY_THRESHOLD将当前链表转化为红黑树。

if (e != null) { // existing mapping for key

    V oldValue = e.value;

    if (!onlyIfAbsent || oldValue == null)

        e.value = value;

    afterNodeAccess(e);

    return oldValue;

}

如果当前key不为空，并且开启了替换模式，将值直接替掉；

++modCount;

if (++size > threshold)

    resize();

当前值大小大于阈值，将当前大小重新定制；到此，最核心的putVal()就浅显的将完成了，虽然还有很多的疑惑为解决；
// Callbacks to allow LinkedHashMap post-actions

void afterNodeAccess(Node<K,V> p) { }

void afterNodeInsertion(boolean evict) { }

void afterNodeRemoval(Node<K,V> p) { }
在代码中这三个方法体时为空的，用于LinkedHashMap的操作；

参考内容：

作者：端木轩

链接：https://www.jianshu.com/p/7dcff1fd05ad

來源：简书

简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

秒客网

HashMap源码解析非原创

HashCode和equals的关系

HashMap源码解析：

HashMap的定义：

HashMap中重要常量：

初始化HashMap

Hash()方法

HashSet核心方法

putVal()方法

源码：

HashMap中的数据结构

回到最骚气的putVal()

参考内容：

相关文章

HashMap源码解析 非原创

HashCode和equals的关系

HashMap源码解析：

HashMap的定义：

HashMap中重要常量：

初始化HashMap

Hash()方法

HashSet核心方法

putVal()方法

源码：

HashMap中的数据结构

回到最骚气的putVal()

参考内容：

相关文章

HashMap源码解析非原创