Java集合之LinkedHashSet源码分析

1.简介

　　我们知道Set不允许包含相同的元素，如果试图把两个相同元素加入同一个集合中，add方法返回false。根据源码实现中的注释我们可以知道LinkedHashSet是具有可预知迭代顺序的Set接口的哈希表和链接列表实现。此实现与HashSet的不同之处在于，后者维护着一个运行于所有条目的双重链接列表。此链接列表定义了迭代顺序，该迭代顺序可为插入顺序或是访问顺序。使用示例如下：

package com.test.collections;

import java.util.Iterator;

import java.util.LinkedHashSet;

public class LinkedHashSetTest {

	/**

	 * @param args

	 */

	public static void main(String[] args) {

		// TODO Auto-generated method stub

		LinkedHashSet<Integer> set = new LinkedHashSet<Integer>();

		set.add(2);

		set.add(4);

		set.add(1);

		Iterator<Integer> iter = set.iterator();

		System.out.println(set.isEmpty());

		System.out.println(set.size());

		System.out.println(set.contains(2));

		System.out.println(set.containsAll(c));

		System.out.println(set.remove(2));

		set.clear();

	}

}

2.继承结构

　　通过源代码可以看到LinkedHashSet继承了HashSet类，实现了Set、Cloneable以及Serializable接口，通过实现了Set接口我们知道不允许包含相同的元素。可是这个功能限制是如何实现的，我们来看下源代码就可以一目了然了。

3.源码解析

　　a:LinkedHashSet类中除了一个序列化ID没有其他的属性了，除了几个构造函数外没有其他的方法，其他的方法都是从HashSet直接继承而来，那就让我们从构造函数入手进行简单的分析。

    public LinkedHashSet(int initialCapacity, float loadFactor) {

        super(initialCapacity, loadFactor, true);

    }

    public LinkedHashSet(int initialCapacity) {

        super(initialCapacity, .75f, true);

    }

    public LinkedHashSet() {

        super(16, .75f, true);

    }

    public LinkedHashSet(Collection<? extends E> c) {

        super(Math.max(2*c.size(), 11), .75f, true);

        addAll(c);

    }

　　从代码中给出的四个构造函数我们可以看出功能各异。我们先来看看简单的构造函数，第一个构造函数制定了两个参数，第二个制定了一个参数，第三个是没有参数设定一个空的构造函数，第四个针对集合的初始化的构造函数。如果我们想要清楚构造函数到底做了什么事情，那么我们需要弄清楚super()方法做了什么事情，以及addAll做了什么事情。看源码：

  HashSet(int initialCapacity, float loadFactor, boolean dummy) {

	map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);

    }

   public boolean addAll(Collection<? extends E> c) {

	boolean modified = false;

	Iterator<? extends E> e = c.iterator();

	while (e.hasNext()) {

	    if (add(e.next()))

		modified = true;

	}

	return modified;

    }

　　原来这两个方法就是我们构造函数出现的。通过第一个方法HashSet,中有一个Map，那这又是什么呢。原来HashSet中有一个熟悉private transient HashMap<E,Object> map;这下我们明白了原来Set的底层是采用一个Map实现的。这个很重要的东西，通过Map的相关方法调用来模仿Set的功能。Super方法做的事情就是创建了一个指定大小和加载因子的Map，addAll()方法就是遍历这个集合然后依次将他们放入我们的Map中去，从而实现了用一个集合直接构造含有值的Set。

　　回过头来我们看看上面的四个构造方法。第一个方法就是制定了初始容量和加载因子的Set,第二个构造函数就是制定了初始容量的Set,使用系统默认的加载因子0.75。第三个构造函数就是直接调用了一个空的构造函数，默认初始化一个容量为16，加载因子为0.75的Set,最后一个就是使用一个集合初始化Set.

b：iterator（）

public Iterator<E> iterator() {

	return map.keySet().iterator();

    }

　　iterator（），调用它就可以返回Set的迭代对象，底层是采用Map的keySet()方法实现的。

c:size()

 public int size() {

	return map.size();

    }

　　直接返回了Map的容量就得到了Set的元素个数。

d:isEmpty()

 public boolean isEmpty() {

	return map.isEmpty();

    }

　　也是调用map的集合是否为空方法。

e:contains()

   public boolean contains(Object o) {

	return map.containsKey(o);

    }

　　判断是否含有某一个元素。

f:add()

 public boolean add(E e) {

	return map.put(e, PRESENT)==null;

    }

g：remove()和clear()

 public boolean remove(Object o) {

	return map.remove(o)==PRESENT;

    }

    public void clear() {

	map.clear();

    }

　　删除元素的时候就是调用map的方法，clear也是一样。

4.其他（小结）

　　LinkedHashSet集合是根据元素的hashCode值来决定元素的存储位置，但是它同时使用链表维护元素的次序。这样使得元素看起来像是以插入顺序保存的，也就是说，当遍历该集合时候，LinkedHashSet将会以元素的添加顺序访问集合的元素。LinkedHashSet在迭代访问Set中的全部元素时，性能比HashSet好，但是插入时性能稍微逊色于HashSet。Set的很多操作都是依赖Map来实现的，下次来学习下Map的源码相关。

秒客网

Java集合之LinkedHashSet源码分析

1.简介

2.继承结构

3.源码解析

4.其他（小结）

相关文章