Java7/8集合框架——基本知识点

时间:2022-11-08 19:33:30

前言

  Java集合框架的内容并不复杂,大概10个左右的常见集合类,建议多看几遍源码,然后回过头再来看看这些各路博客总结的知识点,会有一种豁然开朗的感觉。

一、Java的基础集合

  Java的集合主要有Set、List、Queue、Map等。其中,Set、List、Queue继承于Collection,而Map的实现用于保存具有映射关系的数据(key-value),和Collection有一定的差别,它是另一个上层接口。继承结构如下:

Collection:

Java7/8集合框架——基本知识点

Map:

Java7/8集合框架——基本知识点

二、基本特征:

  • List:有序集合(读取数据和存放数据的顺序一致),元素可以重复,访问元素可以根据元素的索引来访问。
  • Set:无序集合(读取数据和存放数据的顺序不一致),类似于数学上的集合概念,根据元素本身来访问元素和进行重复性判断,因此元素不可以重复。
  • Map:保存Key-value对形式的元素,访问时只能根据每项元素的key来访问其value。
  • Set和Map容器都有基于哈希存储和排序树(红黑树)的两种实现版本,基于哈希存储的版本理论存取时间复杂度为O(1)(没有哈希冲突),而基于排序树版本的实现在插入或删除元素时会按照元素或元素的键(key)构成排序树从而达到排序和去重的效果,各类操作的时间复杂度为O(logN)。

三、集合的几种实现:

  • 数组:数组占用连续内存空间,根据索引查找(即读取)或修改指定索引的元素,速度较快,但是指定索引处的增删慢。
  • 列表:一般通过数组实现,但可以自动扩展,通过将旧元素复制到新的内存空间上进行扩容。
  • 链表:改快读慢;充分利用了内存,存储空间是不连续的,首尾存储上下一个节点的信息,所以寻址麻烦,查找速度慢,但是找到元素后增删快。
  • 哈希表:链表哈希表综合了前两者的优点,一个哈希表,由数组和链表组成。

四、集合常见的实现类:

1、List的常见实现类

  1. ArrayList:数组实现,查询快,指定索引处增删慢(需要移动后续的元素);对插入的元素不进行判断,元素可为空,也可以重复,元素读取和存放同序;轻量级、线程不安全,可以用Collections配合ArrayList实现线程同步;
  2. LinkedList:链表实现,增删快(前提是要找到指定的结点),查询慢
  3. Vector:数组实现,查询快,增删慢,线程安全,重量级

2、Map的常见实现类

  1. HashMap:键值对,key不能重复(相同的key,其旧的value会被覆盖),但是value可以重复;整体实现是数组+链表;允许null的键或值;线程不安全,可配合Collections工具类使用实现线程安全,或者使用ConcurrentHashMap。
  2. Hashtable(弃用):线程安全的,其线程安全是通过Sychronize实现,不允许null的键或值;
  3. Properties::key和value都是String类型,用来读配置文件;
  4. TreeMap:对key排好序的Map;key要实现Comparable接口或TreeMap的构造器中传入Comparator;内部以red-black(红-黑)树数据结构实现,插入,删除和查找的时间复杂度都是O(log n);实现了SortedMap接口。
  5. LinkedHashMap:是HashMap的子类,对HashMap进行了扩展,其与HashMap的不同之处在于,它维护着一个运行于所有条目的双重链接列表。存储的数据是有序的。保存了记录(或访问)的插入顺序

注:ConcurrentHashMap:线程安全,是通过Lock的方式实现的,并且锁分离。ConcurrentHashMap内部使用段(Segment)来表示这些不同的部分,每个段其实就是一个小的hasMap,它们有自己的锁。只要多个修改操作发生在不同的段上,它们就可以并发进行。

3、Set的常见实现类

  1. HashSet:存放重复的元素时,只会保留一个。一般需要重写hashCode()方法,采用恰当的方式分配散列码。内部实现是HashMap,元素为key,value是同个Object对象。
  2. TreeSet:SortedSet的实现类,实现排序,因此添加到TreeSet的元素必须是可排序的(元素自身可排序或者提供Comparator进行排序),它总是平衡的,保证了插入、删除、查询的性能为log(n)。内部实现是TreeMap。
  3. HashSet和TreeSet都实现了Cloneable接口
  4. HashSet的后台有一个HashMap;初始化后台容量;只不过生成一个HashSet的话,系统只提供key的访问;如果有两个Key重复,那么会覆盖之前的;equals返回true,hashCode返回相同的整数;哈希表;存储的数据是无序的。
  5. LinkedHashSet:与HashSet的不同之外在于,维护着一个运行于所有元素的双向链接。存储的数据是有序的。内部实现是LinkedHashMap

五、集合常见实现类的源码解析

List

  1. ArrayList实现原理:参考我的博客:Java7/8集合框架——LinkedList
  2. LinkedList实现原理:参考我的博客:Java7/8集合框架——LinkedList
  3. Vector实现原理:其实现和ArrayList类似,因方法中使用了synchronized进行同步,是线程安全的

Map

  1. HashMap和ConcurrentHashMap实现原理:参考别人的博客:Java7/8 中的 HashMap 和 ConcurrentHashMap 全解析
  2. LinkedHashMap实现原理:扩展自HashMap,加了自己的一些扩展功能,以支持双向链表。待补充。。。。

Set

  1. HashSet实现原理:其底层使用HashMap,元素为key,而value是同一个Object,即private static final Object PRESENT = new Object();原理类似。
  2. LinkedHashSet实现原理:扩展自HashSet,但是其底层使用LinkedHashMap,元素为key,而value是同一个Object,即private static final Object PRESENT = new Object();原理和LinkedHashMap类似。
  3. TreeSet实现原理:底层是使用TreeMap。

六、Collection、Collections、Arrays

  1. Collection:集合类的上级接口,继承于他的接口主要有Set、List。Set里的元素是不能重复的,equals()方法来区分重复与否。
  2. Collections:是针对集合类的一个工具类,提供一系列静态方法实现对各种集合的搜索、排序、线程安全化等操作。
  3. Arrays:此类包含用来操作数组(比如排序和搜索)的各种方法。

 

七、其他

以下这几点的内容待研究和补充。。。。

1、集合迭代Iterator

2、Iterator的fail-fast和fail-safe

  1. 每次我们尝试获取下一个元素的时候,Iterator的fail-fast属性检查当前集合结构里的任何改动(使用内部属性modCount,修改计数器)。如果发现任何改动,它抛出ConcurrentModificationException。Collection中所有Iterator的实现都是按fail-fast来设计的(ConcurrentHashMap和CopyOnWriteArrayList这类并发集合类除外)。
  2. Iterator的fail-fast属性与当前的集合共同起作用,因此它不会受到集合中任何改动的影响。Java.util包中的所有集合类都被设计为fail-fast的,而java.util.concurrent中的集合类都为fail-safe的。Fail-fast迭代器抛出ConcurrentModificationException,而fail-safe迭代器从不抛出ConcurrentModificationException。
  3. 在Java Fail fast 迭代器中,迭代objects集合有时会出现并发修改异常,出现这种情况有2个原因:①如果一个线程正在迭代一个集合,而另一个线程同时试图修改这个集合;②遍历过程中,试图去修改集合。注:在遍历过程中调用remove()方法不会引起ConcurrentModificationException。
  4. fail-fast(快速失败):快速失败机制在遍历一个集合时,如果集合内容被修改,会抛出ConcurrentModificationException异常。
  5. fail-safe(安全失败):安全失败机制对集合的任何修改都会在一个复制的集合上进行,因此不会抛出异常。