浅谈Java的集合框架
一、 初识集合
重所周知,Java有四大集合框架群,Set、List、Queue和Map。四种集合的关注点不同,Set 关注事物的唯一性,List 关注事物的索引列表,Queue 关注事物被处理时的顺序,Map 关注事物的映射和键值的唯一性。其中前三类直接继承于Collection接口,Map单独为接口,他们的继承实现关系如下图所示。
二、 Collection接口
Collection接口是 Set 、List 和 Queue 接口的父接口,提供了多数集合常用的方法声明,包括 add()、remove()、contains()、size()、terator() 等,用法如下表所示
方法 |
含义 |
add(E e) |
将指定对象添加到集合中 |
remove(Object o) |
将指定的对象从集合中移除,移除成功返回true,不成功返回false |
contains(Object o) |
查看该集合中是否包含指定的对象,包含返回true,不包含返回flase |
size() |
返回集合中存放的对象的个数。返回值为int |
clear() |
移除该集合中的所有对象,清空该集合。 |
iterator() |
返回一个包含所有对象的iterator对象,用来循环遍历 |
toArray() |
返回一个包含所有对象的数组,类型是Object |
toArray(T[] t) |
返回一个包含所有对象的指定类型的数组 |
三、Set
Set关心唯一性,它不允许重复。
在Set的集合群中,Set接口继承Collection接口,然后抽象类AbstractSet实现Set接口。
HashSet 类
当不希望集合中有重复值,并且不关心元素之间的顺序时可以使用此类。
HashSet 类是继承AbstractSet抽象并实现Set接口的,其低层的存储结构是基于HashMap类实现的,即当往HashSet中添加一个元素时,其实HashSet是通过建立的HashMap集合并往里添加一个该元素(把该元素设为Key),因此也保证了HashSet集合的元素唯一性。以为HashMap集合是线程不安全的,所以HashSet集合也是线程不安全的。
TreeSet 类
当不希望集合中有重复值,并且希望按照元素的自然顺序进行排序时可以采用此类。(自然顺序意思是某种和插入顺序无关,而是和元素本身的内容和特质有关的排序方式,譬如“abc”排在“abd”前面。)
TreeSet类是继承抽象类AbstractSet类实现的,其低层是通过TreeMap类来实现的,因为TreeMap类是通过红黑树的结构实现的,所以TreeSet类也可以说是通过红黑树的结构实现的。
EnumSet 类
EnumSet是专门为枚举类设计的集合类,Enum中所有元素都必须是指定的枚举值,所有集合元素必须来自于同一个枚举类。EnumSet的集合元素也是有序的,以枚举值在Enum类内的定义顺序来决定集合元素的顺序。
EnumSet在内部以位向量的形式存储,这种形式非常紧凑、高效,因此EnumSet对象占用内存很小,而且运行效率很高,EnumSet是所有Set实现类中性能最好的。
EnumSet集合对于初学者可能是不很常用,这里我附一段其代码
enum Season{
spring,summer,fall,winter
}
public class EnumSetTest {
public static void main(String[] args) {
//创建一个EnumSet集合,集合元素就是Season的全部枚举值
EnumSet es = EnumSet.allOf(Season.class);
System.out.println(es);//输出为[spring, summer, fall, winter]
es.add(Season.spring);
System.out.println(es);//输出为[spring, summer, fall, winter]
//创建一个EnumSet的空集合,指定其集合元素是Season的枚举值
EnumSet es2 = EnumSet.noneOf(Season.class);
System.out.println(es2);//输出为[]
es2.add(Season.spring);
es2.addAll(es);//添加一个EnumSet
System.out.println(es);//输出为[spring, summer, fall, winter]
//以指定枚举值创建EnumSet
EnumSet es3 = EnumSet.of(Season.spring,Season.summer);
}
}
LinkedHashset 类
当不希望集合中有重复值,并且希望按照元素的插入顺序进行迭代遍历时可采用此类。这是HashSet的子类,对于插入、删除操作,LinkedList比HashSet要慢一些,因为要维护链表,但是由于有了链表结构,遍历LinkedList会更快。
其父类是HashSet,LinkedHashSet类的实现也依赖于其父类HashSet的结构与方法。
Set集合的性能分析
1、HashSet和TreeSet比较时,HashSet在数据的添加、查询等操作时性能高于TreeSet,因为TreeSet需要用红黑树算来维护集合元素的次序,只有需要集合元素保持排序时,才应该使用TreeSet集合。
2、Set 的三个实现类 HashSet、TreeSet和EnumSet都是线程不安全的。如果多线程并发操作Set集合,可以通过Collections工具类的synchronizedSortedSet 方法来包装该Set集合。
四、List
List 关心的是索引,与数组类似,但是List长度是可变的的,List集合也是可重复的,与其他集合相比,List特有的就是和索引相关的一些方法:get(int index) 、 add(int index,Object o) 、 indexOf(Object o) 。
在List 的集合群中,List接口直接继承Collection接口,然后抽象类AbstractList实现List接口。
ArrayList
可理解成一个可增长的数组,它提供快速迭代和快速随机访问的能力。ArrayList是基于数组实现的。ArrayList类继承AbstractList类实现。
LinkedList
当需要快速插入和删除时可选用LinkedList。LinkedList是基于双端链表结构实现的,提供双端队列和栈的功能。
Vector
是ArrayList的线程安全版本,性能比ArrayList要低,现在已经很少使用
更好的使用List集合:
1、如果需要遍历集合元素,对于ArrayList和Vector集合,由于这两类集合使用数组来实现(封装了一个动态的、允许再分配的Object[] 数组),所以使用随机访问方法 get性能更好(get(key)通过索引数组下标来获得元素);对于LinkedList集合,因为其结构是基于链的线性表,所以用迭代器Iterator来遍历集合元素,如下
for(Iterator it = collection.iterator(); it.hasNext();) {
Object o = it.next();
}
2、如果需要经常执行插入、删除来操作已包含大量数据的List集合,建议使用LinkedList集合,其只需增加删除一个节点即可,高效快捷;而对于ArrayList和Vector的插入、删除操作,则需要重新分配数组大小及移动数据,效果较差。
3、如果有多个线程同时访问List集合时,ArrayList、LinkedList等集合时线程不安全的,虽然Vector集合线程安全,但是性能极低,这是我们需要使用Collections讲集合包装成线程安全的集合。
五、Queue
Queue关注事物被处理时的顺序,用于保存将要执行的任务列表,其用于模拟队列这种数据结构,队列通常是值“先进先出(FIFO)”的容器。Queue接口直接继承Collection接口,抽象类AbstractQueue 实现Queue接口。
LinkedList
不仅实现了List,同样实现了Queue接口,模拟先进先出的队列结构。
PriorityQueue
用来创建自然排序的优先级队列。
五、Map
Map关心的是唯一的标识符。他将唯一的键映射到某个元素。当然键和值都是对象。(这里只是概括一下Map,具体的Map介绍,请看我的另一篇,HashMap的低层实现)
Map集合是Java集合框架的使用的最频繁的集合,而且Set集合也都是通过Map集合来实现的。
Map 接口在现在的Java版本中没有继承Collection接口,自己为一个接口,通过抽象类AbstractMap 来实现Map接口。
HashMap
当需要键值对表示,又不关心顺序时可采用HashMap。HashMap集合是线程不安全的。
Hashtable
它在较早版本中出现,现在已经很少使用。Hashtable集合是线程安全的,不过其加锁机制也使得其性能非常低。
LinkedHashMap
当需要键值对,并且关心插入顺序时可采用它。其继承父类Hashmap实现。
TreeMap
当需要键值对,并关心元素的自然排序时可采用它。其是通过红黑树这种结构实现的。