HashMap源码解析 非原创

时间:2022-05-08 15:11:03

HashMap源码解析 非原创

Stack过时的类,使用Deque重新实现。

HashCode和equals的关系

HashCode为hash码,用于散列数组中的存储时HashMap进行散列映射。

equals方法适用于比较两个对象是否相同,Object方法的equals方法默认为比较两个对象的地址是否相同

    public boolean equals(Object obj) {
return (this == obj);
}

在实际开发中hashcode()和equals()都需要自己重写并且需要保证一下原则

  • 两个对象equals(),那么这两个对象的hashcode()一定相等
  • 两个对象hashcode相等,其不一定equals(),因为hashcode函数仅仅是做分散,最终还是会发生一定的冲突

可以考虑在集合中,判断两个对象是否相等的规则是:

    第一步,如果hashCode()相等,则查看第二步,否则不相等;

    第二步,查看equals()是否相等,如果相等,则两obj相等,否则还是不相等。

public static void main(String[] args) {
Object o1 = new Object();
Object o2 = new Object();
System.out.println("hashcode o1 :"+o1.hashCode());
System.out.println("hashcode o2 :"+o2.hashCode());
System.out.println("o1 equals o2 ?"+o1.equals(o2));
}

hashcode o1 :1826771953

hashcode o2 :1406718218

o1 equals o2 ?false

HashMap源码解析:

HashMap的定义:

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

​ 继承抽象AbstractMap,实现了Map。

HashMap中重要常量:

//默认容量

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;

//最大容量

static final int MAXIMUM_CAPACITY = 1 << 30;

//默认加载因子

static final float DEFAULT_LOAD_FACTOR = 0.75f;

//链表转成红黑树的阈值

static final int TREEIFY_THRESHOLD = 8;

//红黑树转为链表的阈值

static final int UNTREEIFY_THRESHOLD = 6;

//存储方式由链表转成红黑树的容量的最小阈值

static final int MIN_TREEIFY_CAPACITY = 64;

//HashMap中存储的键值对的数量

transient int size;

//扩容阈值,当size>=threshold时,就会扩容

int threshold;

//HashMap的加载因子

final float loadFactor;

需要指出的是这里loadFactor加载因子在初始化后就不能变更。加载因子也可以叫做扩充因子----毕竟只是拿来判断是否扩容的嘛(#.#)。

初始化HashMap

Map<K,V> map = new HashMap<K,V>();

或者 Map<K,V> map = new HashMap<K,V>(31)

实际调用的代码

public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

this(initialCapacity,DEAULT_LOAD_FACTOR);

public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}

在初始化中会判断,初始化参数是否小于0,抛出IllegalArgumentException();如果HashMap的最大容量MAXIMUM_CAPACITY(也就是2的32次方 ,为什么是2的32次方呢? ),在确定threhold扩容阈值。

细心的同学可能注意到HashMap中所有常量的定义都是int型,Java中int型是32位的。

接下来就是对tableSizeFor的解释:

/**
* Returns a power of two size for the given target capacity.
*/
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

源代码中注释的写的是获取与cap最相近的2的幂。

例如 32 会产生32 而33就会产生64,这个式子很神奇,为什么正确,我也不太明了o(╥﹏╥)o。

Hash()方法

static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

^是异或操作 1^1 =0 ;1^0 = 1; 0^1 =1 ;0^0=0; 多位的异或,比如3^2 = 1 (11^10 = 01);

这里需要解释的是,如果(h = key.hashCode())^(h>>>16) 是取h的低16位与高16为进行异或作为低16位与h的高16位进行拼接,得到最后的hash值。 据说能够提高hash的分散程度。嘤嘤嘤。

还有提到一点就是HashSet内部是使用HashMap实现的;这个在解析HashSet的时候会详细提到;

/**
HashSet的Add的方法
*/
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}

HashSet核心方法

putVal()方法

源码:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}

我们慢慢来分析。首先看入参:

  • hash:表示key的hash值
  • key:待存储的key值
  • value:待存储的value值,从这个方法可以知道,HashMap底层存储的是key-value的键值对,不只是存储了value
  • onlyIfAbsent:这个参数表示,是否需要替换相同的value值,如果为true,表示不替换已经存在的value
  • evict:如果为false,表示数组是新增模式

我们看到put时所传入的参数put(hash(key), key, value, false, true),可以得到相应的含义。

作者:端木轩

链接:https://www.jianshu.com/p/7dcff1fd05ad

來源:简书

简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

HashMap中的数据结构

在继续下一步分析之前,我们首先需要看一下HashMap底层的数据结构。

HashMap源码解析 非原创

HashMap的数据结构

我们可以看到,HashMap底层是数组加单向链表或红黑树实现的(这是JDK 1.8里面的内容,之前的版本纯粹是数组加单向链表实现)。

回到最骚气的putVal()

Node<K,V>[] tab; Node<K,V> p; int n, i;

Node<K,V>[] tab 用于引用table也就是hash表;

Node<K,V> p 用于指向需要指向红黑树或者链表;

int n 用于存储当前table的长度;

int i 用于存储当前访问的table索引;

if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;

如果表为空或这表的长度为零重新分配表;

if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);

如果当前访问的桶为空,初始化一个新的节点

Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;

当前的hash值等于。。。

else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

当前访问的桶是红黑树,将该值放入红黑树中;

for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}

如果桶是空的,将节点添加到链表后面,如果当前链表长度大于TREEIFY_THRESHOLD将当前链表转化为红黑树。

if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}

如果当前key不为空,并且开启了替换模式,将值直接替掉;

++modCount;
if (++size > threshold)
resize();

当前值大小大于阈值,将当前大小重新定制;到此,最核心的putVal()就浅显的将完成了,虽然还有很多的疑惑为解决;

// Callbacks to allow LinkedHashMap post-actions
void afterNodeAccess(Node<K,V> p) { }
void afterNodeInsertion(boolean evict) { }
void afterNodeRemoval(Node<K,V> p) { }

在代码中这三个方法体时为空的,用于LinkedHashMap的操作;

参考内容:

作者:端木轩

链接:https://www.jianshu.com/p/7dcff1fd05ad

來源:简书

简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。