java中Map,List与Set的差别

时间:2021-03-13 02:59:18
java集合的主要分为三种类型:
  • Set(集)
  • List(列表)
  • Map(映射)
要深入理解集合首先要了解下我们熟悉的数组:
数组是大小固定的,而且同一个数组仅仅能存放类型一样的数据(基本类型/引用类型)。而JAVA集合能够存储和操作数目不固定的一组数据。 全部的JAVA集合都位于 java.util包中! JAVA集合仅仅能存放引用类型的的数据。不能存放基本数据类型。
简单说下集合和数组的差别:(參考文章:《Thinking In Algorithm》03.数据结构之数组)

  1. <span style="font-family:Microsoft YaHei;font-size:12px;">世间上本来没有集合,(仅仅有数组參考C语言)但有人想要,所以有了集合
  2. 有人想有能够自己主动扩展的数组,所以有了List
  3. 有的人想有没有反复的数组,所以有了set
  4. 有人想有自己主动排序的组数,所以有了TreeSet,TreeList,Tree**
  5. 而差点儿有有的集合都是基于数组来实现的.
  6. 由于集合是对数组做的封装,所以,数组永远比不论什么一个集合要快
  7. 但不论什么一个集合,比数组提供的功能要多
  8. 一:数组声明了它容纳的元素的类型。而集合不声明。这是因为集合以object形式来存储它们的元素。
  9. 二:一个数组实例具有固定的大小,不能伸缩。集合则可依据须要动态改变大小。
  10. 三:数组是一种可读/可写数据结构---没有办法创建一个仅仅读数组。然而能够使用集合提供的ReadOnly方法。以仅仅读方式来使用集合。

    该方法将返回一个集合的仅仅读版本号。</span>

Java全部“存储及随机訪问一连串对象”的做法。array是最有效率的一种。


1、

效率高。但容量固定且无法动态改变。

array另一个缺点是,无法推断当中实际存有多少元素,length仅仅是告诉我们array的容量。

2、Java中有一个Arrays类,专门用来操作array

     arrays中拥有一组static函数,

equals():比較两个array是否相等。array拥有同样元素个数,且全部相应元素两两相等。

fill():将值填入array中。

sort():用来对array进行排序。

binarySearch():在排好序的array中寻找元素。

System.arraycopy():array的复制。

若撰敲代码时不知道到底须要多少对象,须要在空间不足时自己主动扩增容量,则须要使用容器类库,array不适用。所以就要用到集合。
那我们開始讨论java中的集合。
集合分类:
Collection:List、Set

Map:HashMap、HashTable

1.1 Collection接口

Collection是最主要的集合接口。声明了适用于JAVA集合(仅仅包含Set和List)的通用方法。 Set 和List 都继承了Conllection,Map。

1.1.1  Collection接口的方法:

  1. <span style="font-weight: normal;">boolean add(Object o)      :向集合中增加一个对象的引用
  2. void clear():删除集合中全部的对象,即不再持有这些对象的引用
  3. boolean isEmpty()    :推断集合是否为空
  4. boolean contains(Object o) : 推断集合中是否持有特定对象的引用
  5. Iterartor iterator()  :返回一个Iterator对象。能够用来遍历集合中的元素
  6. boolean remove(Object o) :从集合中删除一个对象的引用
  7. int size()       :返回集合中元素的数目
  8. Object[] toArray()    : 返回一个数组,该数组中包含集合中的全部元素 </span>

关于:Iterator() 和toArray() 方法都用于集合的全部的元素。前者返回一个Iterator对象。后者返回一个包括集合中全部元素的数组。

1.1.2  Iterator接口声明了例如以下方法:

  1. hasNext():推断集合中元素是否遍历完成,假设没有,就返回true
  2. next() :返回下一个元素
  3. remove():从集合中删除上一个有next()方法返回的元素。

1.2  Set(集合)

Set是最简单的一种集合。

集合中的对象不按特定的方式排序。而且没有反复对象。 Set接口主要实现了两个实现类:

  • HashSet: HashSet类依照哈希算法来存取集合中的对象。存取速度比較快
  • TreeSet :TreeSet类实现了SortedSet接口,可以对集合中的对象进行排序。

Set 的使用方法:存放的是对象的引用,没有反复对象

  1. Set set=new HashSet();
  2. String s1=new String("hello");
  3. String s2=s1;
  4. String s3=new String("world");
  5. set.add(s1);
  6. set.add(s2);
  7. set.add(s3);
  8. System.out.println(set.size());//打印集合中对象的数目 为 2。

Set 的 add()方法是怎样推断对象是否已经存放在集合中?

  1. boolean isExists=false;
  2. Iterator iterator=set.iterator();
  3. while(it.hasNext())           {
  4. String oldStr=it.next();
  5. if(newStr.equals(oldStr)){
  6. isExists=true;
  7. }
  8. }

Set的功能方法

Set具有与Collection全然一样的接口,因此没有不论什么额外的功能,不像前面有两个不同的List。实际上Set就是Collection,仅仅 是行为不同。(这是继承与多态思想的典型应用:表现不同的行为。)Set不保存反复的元素(至于怎样推断元素同样则较为负责)

Set : 存入Set的每一个元素都必须是唯一的,由于Set不保存反复元素。增加Set的元素必须定义equals()方法以确保对象的唯一性。Set与Collection有全然一样的接口。

Set接口不保证维护元素的次序。

  • HashSet:为高速查找设计的Set。存入HashSet的对象必须定义hashCode()。
  • TreeSet: 保存次序的Set, 底层为树结构。使用它能够从Set中提取有序的序列。
LinkedHashSet:具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。

1.3  List(列表)

List的特征是其元素以线性方式存储,集合中能够存放反复对象。 


List接口主要实现类包含:(參考文章:ArrayList与LinkedList的差别
  • ArrayList() : 代表长度能够改变得数组。能够对元素进行随机的訪问。向ArrayList()中插入与删除元素的速度慢。
  • LinkedList(): 在实现中採用链表数据结构。插入和删除速度快。訪问速度慢。

对于List的随机訪问来说。就是仅仅随机来检索位于特定位置的元素。 List 的 get(int index) 方法放回集合中由參数index指定的索引位置的对象,下标从“0” 開始。最主要的两种检索集合中的全部对象的方法: 





      1: for循环和get()方法: 

  1. for(int i=0; i<list.size();i++){
  2. System.out.println(list.get(i));
  3. }

2: 使用 迭代器(Iterator):

  1. Iterator it=list.iterator();
  2. while(it.hashNext()){
  3. System.out.println(it.next());
  4. }

List的功能方法

实际上有两种List:一种是主要的ArrayList,其长处在于随机訪问元素,还有一种是更强大的LinkedList,它并非为高速随机訪问设计的。而是具有一套更通用的方法。

  • List:次序是List最重要的特点:它保证维护元素特定的顺序。List为Collection加入了很多方法,使得能够向List中间插入与移除元素(这仅仅推 荐LinkedList使用。)一个List能够生成ListIterator,使用它能够从两个方向遍历List,也能够从List中间插入和移除元 素。
  • ArrayList:由数组实现的List。同意对元素进行高速随机訪问。可是向List中间插入与移除元素的速度非常慢。ListIterator仅仅应该用来由后向前遍历 ArrayList,而不是用来插入和移除元素。

    由于那比LinkedList开销要大非常多。

  • LinkedList :对顺序訪问进行了优化,向List中间插入与删除的开销并不大。

    随机訪问则相对较慢。(使用ArrayList取代。)还具有下列方 法:addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast(), 这些方法 (没有在不论什么接口或基类中定义过)使得LinkedList能够当作堆栈、队列和双向队列使用。

1.4 Map(映射)

Map 是一种把键对象和值对象映射的集合。它的每个元素都包括一对键对象和值对象。

Map没有继承于Collection接口 从Map集合中检索元素时,仅仅要给出键对象,就会返回相应的值对象。

Map 的经常用法:

1 加入,删除操作:

  1. Object put(Object key, Object value): 向集合中增加元素
  2. Object remove(Object key): 删除与KEY相关的元素
  3. void putAll(Map t):  将来自特定映像的全部元素加入给该映像
  4. void clear():从映像中删除全部映射

2 查询操作:

Object get(Object key):获得与keywordkey相关的值 。Map集合中的键对象不同意反复。也就说,随意两个键对象通过equals()方法比較的结果都是false.。可是能够将随意多个键独享映射到同一个值对象上。

Map的功能方法

方法put(Object key, Object value)加入一个“值”(想要得东西)和与“值”相关联的“键”(key)(使用它来查找)。

方法get(Object key)返回与给定“键”相关联的“值”。能够用containsKey()和containsValue()測试Map中是否包括某个“键”或“值”。 标准的Java类库中包括了几种不同的Map:HashMap, TreeMap, LinkedHashMap, WeakHashMap, IdentityHashMap。它们都有相同的基本接口Map,可是行为、效率、排序策略、保存对象的生命周期和判定“键”等价的策略等各不相同。

运行效率是Map的一个大问题。

看看get()要做哪些事,就会明确为什么在ArrayList中搜索“键”是相当慢的。

而这正是HashMap提快速 度的地方。

HashMap使用了特殊的值。称为“散列码”(hash code),来代替对键的缓慢搜索。“散列码”是“相对唯一”用以代表对象的int值。它是通过将该对象的某些信息进行转换而生成的。

全部Java对象都 能产生散列码,由于hashCode()是定义在基类Object中的方法。

HashMap就是使用对象的hashCode()进行高速查询的。此方法可以显着提高性能。

Map : 维护“键值对”的关联性。使你能够通过“键”查找“值”

HashMap:Map基于散列表的实现。

插入和查询“键值对”的开销是固定的。

能够通过构造器设置容量capacity和负载因子load factor,以调整容器的性能。

LinkedHashMap: 类似于HashMap,可是迭代遍历它时。取得“键值对”的顺序是其插入次序,或者是近期最少使用(LRU)的次序。

仅仅比HashMap慢一点。而在迭代訪问时发而更快,由于它使用链表维护内部次序。

TreeMap : 基于红黑树数据结构的实现。

查看“键”或“键值对”时,它们会被排序(次序由Comparabel或Comparator决定)。TreeMap的特点在 于,你得到的结果是经过排序的。TreeMap是唯一的带有subMap()方法的Map。它能够返回一个子树。

WeakHashMao :弱键(weak key)Map,Map中使用的对象也被同意释放: 这是为解决特殊问题设计的。假设没有map之外的引用指向某个“键”,则此“键”能够被垃圾收集器回收。

IdentifyHashMap: : 使用==取代equals()对“键”作比較的hash map。专为解决特殊问题而设计。

1.4 差别

1.4.1、Collection 和 Map 的差别

容器内每一个为之所存储的元素个数不同。

Collection类型者,每一个位置仅仅有一个元素。

Map类型者,持有 key-value pair,像个小型数据库。

1.4.2、各自旗下的子类关系

Collection

     --List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。

           --ArrayList / LinkedList / Vector

     --Set : 不能含有反复的元素

           --HashSet / TreeSet

      Map

     --HashMap

     --HashTable

     --TreeMap

1.4.3、其它特征

List。Set,Map将持有对象一律视为Object型别。

Collection、List、Set、Map都是接口。不能实例化。

继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化。

vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。

总结

1. 假设涉及到堆栈,队列等操作,应该考虑用List,对于须要高速插入,删除元素,应该使用LinkedList。假设须要高速随机訪问元素,应该使用ArrayList。

2. 假设程序在单线程环境中,或者訪问只在一个线程中进行。考虑非同步的类,其效率较高,假设多个线程可能同一时候操作一个类。应该使用同步的类。

3. 在除须要排序时使用TreeSet,TreeMap外,都应使用HashSet,HashMap,由于他们 的效率更高。

4. 要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。

 

5. 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。

一旦将对象置入容器内,便损失了该对象的型别信息。

6. 尽量返回接口而非实际的类型,如返回List而非ArrayList,这样假设以后须要将ArrayList换成LinkedList时,client代码不用改变。这就是针对抽象编程。

注意:
1、Collection没有get()方法来取得某个元素。

仅仅能通过iterator()遍历元素。

2、Set和Collection拥有一模一样的接口。
3、List,能够通过get()方法来一次取出一个元素。

使用数字来选择一堆对象中的一个。get(0)...。(add/get)

4、一般使用ArrayList。

用LinkedList构造堆栈stack、队列queue。

5、Map用 put(k,v) / get(k),还能够使用containsKey()/containsValue()来检查当中是否含有某个key/value。
      HashMap会利用对象的hashCode来高速找到key。
6、Map中元素。能够将key序列、value序列单独抽取出来。
使用keySet()抽取key序列。将map中的全部keys生成一个Set。
使用values()抽取value序列。将map中的全部values生成一个Collection。
为什么一个生成Set,一个生成Collection?那是由于,key总是独一无二的,value同意反复。


Reference:

http://developer.51cto.com/art/201309/410205_all.htm

http://billy-lee.iteye.com/blog/356398