Java源码 HashMap

时间:2021-08-10 19:16:43

 HashMap类

  https://docs.oracle.com/javase/8/docs/api/java/util/HashMap.html

  

  public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

  

  子类:LinkedHashMap,PrinterStateReasons

 

Java源码 HashMap

  一、介绍

  HashMap继承了AbstractMap类,AbstractMap类实现Map接口中的一些方法,是为了最大限度地减少实现Map接口需要进行的工作量,提高代码重用。  

  Cloneable接口可以理解为一个标记接口,它并没有定义方法。当一个对象调用Object的clone方法时,如果这个对象没有实现Cloneable接口,会引发CloneNotSupportedException异常。(关于对象的拷贝,有深拷贝和浅拷贝的知识)clone方法执行的是浅拷贝,这个接口就是指示可以使用Object的clone方法。

  

  HashMap类实现了Map接口中所有的“可选操作”,允许key和value为null,非同步。

  HashTable类与HashMap几乎一致,区别在于HashTable不允许key和value为null,而且是同步的。

  HashMap无法保证其中键值对的顺序,即它无法保证键值对的顺序会一直保持不变。

 

  HashMap类为基本的get和put操作,提供了常数时间的性能。

  HashMap的集合视图上的迭代器所需要的时间和(HashMap实例的容量加上键值对的数量)成正比。所以,当需要考虑迭代器的性能时,不要把HashMap实例的容量(capacity属性)设置得太高,或者别把load factor设置得太低。

  如上提到的,一个HashMap实例有两个最重要的参数影响着它的性能:初始的capacity值和load factor值。

  capacity是哈希表中桶的数量,它的初始值代表着HashMap实例创建时桶的数量。

  load factor,在这个哈希表实例进行容量自动增长前,用来度量这个哈希表“满”的程度。

  当哈希表中中键值对条目的数量超过load-factor和当前capacity的乘积时,哈希表就会被重新映射(is rehashed),这意味着它内部的数据结构被重建了,结果便是“新”的哈希表拥有了两倍的桶数。(像数组的自动扩容)

 

  通常,HashMap的默认load-factor是0.75,这在时间代价和空间代价提供了一个很好的平衡。

  load-factor过高会减少空间开销,但会增加查找成本,这体现在类中的大部分操作中,包括get和put。

  因此,在设置初始的capacity值时,需要好好考虑HashMap中键值条目的数量以及负载因子,以尽可能减少重新散列的次数。如果初始capacity大于(最大入口数除以负载因子),哈希表就不会进行重新散列。

  

  如果你有比较多的键值对需要存进HashMap,最好在创建它时配置一个足够大的capacity,比起容量不足然后进行重散列,这样可以更有效地存储映射。

  需要注意的是,如果多个key的hashcode()值相同,会降低哈希表的性能。为了改善这种情况,若key实现了Comparable接口,HashMap可能会利用key之间的比较顺序(comparison order)来消除“并列”(break ties)。

 

  由于HashMap是不同步的,当多个线程并发访问一个HashMap时,若其中至少一个线程对HashMap进行了结构性的修改,那么就必须在外部进行同步(it must be synchronized externally)。这通常是通过自然封装了HashMap的对象上完成的,如果这样的对象不存在,那么这个HashMap就应该通过Collections.synchronizedMap方法装饰,并且最好在创建时就进行,以防止这个HashMap上有以外的非同步访问:

Map m = Collections.synchronizedMap(new HashMap(...));

  (所谓的结构性修改(structural modification)是增加or删除键值记录的操作,如果仅仅是改变其中某个key关联的value,不属于结构性操作。)

 

  HashMap类的所有集合视图的产生方法所返回的迭代器都具有“快速失效”属性:当一个实例在迭代器被创建后被进行了结构性的修改(除了通过迭代器的remove方法),迭代器会抛出一个 ConcurrentModificationException。所以,面对并发修改,迭代器会明确而快速地失效,而不是仍然承担着并不确定的行为的风险。

  需要注意的是,迭代器并不保证它的“快速失效”属性,因为在存在非同步并发修改的情形下,不可能做出任何硬性保证。

  所以,迭代器的快速失效行为应该仅用于检测错误。

 

  二、HashMap的嵌套类

  继承自AbstractMap的嵌套类:AbstractMap.SimpleEntry<K,V>, AbstractMap.SimpleImmutableEntry<K,V>

  继承自Map接口的嵌套类:Map.Entry<K,V>

  事实是,HashMap中有许多嵌套类:

Java源码 HashMap

  如图:

  Node类实现了Map.Entry<K,V>接口,源码描述为“Basic hash bin node, used for most entries”,即为存储单条键值映射记录的数据结构;

  TreeNode类是“Entry for Tree bins”,这个是在某些情况下可以用来替代Node的(when bins get too large, they are transformed into bins of TreeNodes),该类继承自LinkedHashMap.Entry<K,V>。

  KeySet、Values、EntrySet的嵌套类和返回集合视图的三个方法相关;

 

  本来不打算解析嵌套类的,但是它们和很多方法息息相关,所以干脆好好分析一波!

  1、HashMap的属性

Java源码 HashMap 

  如图,基本可以通过名称判断相关属性的作用。

  size,表示当前map中键值映射记录的条数;

  带treeify字段的属性,好像是和Node转换成TreeNode的操作有关的;

  threshold意思是门槛、开始,用于判断map是否进行resize操作的标准。

  table,一个包含Node元素的数组,会在第一次使用时被初始化。这个数组的长度,总是整数2的幂。

  modCount,记录这个map被结构性修改的次数;

 

  2、 static class Node<K,V> implements Map.Entry<K,V> 

  注意到,其中key为final,但是value不为final,关注下put方法中包含相同key时的处理方法。

  这里的hash暂时没明白干嘛的;

  next是不是表明了,键值映射记录的存储方式是链表?

/**
     * Basic hash bin node, used for most entries.  (See below for
     * TreeNode subclass, and in LinkedHashMap for its Entry subclass.)
     */
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

 

  三、构造器

  根据Java集合框架的规约,集合类都应该提供一个无参构造器和一个Collection or Map类型的单参构造器,前者用于构造空的集合,后者用于复制另一个集合。

  •   HashMap(),构造一个空的HashMap实例,默认capacity为16,默认load-factor是0.75。
  •   HashMap(Map<? extends K,? extends V> m),这里的初始capacity,满足需求即可。
  •   HashMap(int initialCapacity)
  •   HashMap(int initialCapacity, float loadFactor)

 

  四、方法

  1、public int size()

  返回键map中值映射记录的条数;

 

  2、public boolean isEmpty()

  如果map中还没有存储键值映射的记录,返回true。

public boolean isEmpty() {
        return size == 0;
    }

 

  3、static final int hash(Object key)

  待会看看它的用法。

static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

 

 

  4、public V get(Object key)

  返回指定key所映射的value值;若map不包含此key的映射,返回null。

  特殊的情况是,这个key所映射的value值恰好为null,这时就需要利用containKey()来区分这两种情况了。

  

  5、public boolean containsKey(Object key)

  查询map中是否包含指定的key

 

  6、public V put(K key, V value)

  关联指定的key和value,即是他们称为map中的键值对,可以通过key查到这个value。

  如果key存在,对value进行替换。

 

  7、public void putAll(Map<? extends K,? extends V> m)

  将指定map中的所有映射复制到此map。

  如果key已存在,则其值会被新的替换。

 

  8、public V remove(Object key)

  9、public void clear()

  清空map

 

  10、public boolean containsValue(Object value)

  判断是否map中有一个或者多个key的映射值为指定的value。

 

  11、public Set<K> keySet()

  Returns a Set view of the keys contained in this map.

 

  12、public Collection<V> values()

  Returns a Collection view of the values contained in this map.

 

  13、public Set<Map.Entry<K,V>> entrySet()

  Returns a Set view of the mappings contained in this map

 

  14、public V putIfAbsent(K key, V value)

  If the specified key is not already associated with a value (or is mapped to null) associates it with the given value and returns null, else returns the current value.

 

  15、public boolean remove(Object key, Object value)

  

  16、public boolean replace(K key, V oldValue, V newValue)

  Replaces the entry for the specified key only if currently mapped to the specified value.