Java集合

时间:2024-11-07 07:03:01

Java 集合概览:

Java 集合,也叫作容器,主要是由两大接口派生而来:一个是 Collection接口,主要用于存放单一元素;另一个是 Map 接口,主要用于存放键值对。对于Collection 接口,下面又有三个主要的子接口:ListSetQueue

List, Set, Queue, Map 四者的区别? 

  • List(对付顺序的好帮手): 存储的元素是有序的、可重复的。
  • Set(注重独一无二的性质): 存储的元素不可重复的。
  • Queue(实现排队功能的叫号机): 按特定的排队规则来确定先后顺序,存储的元素是有序的、可重复的。
  • Map(用 key 来搜索的专家): 使用键值对(key-value)存储,类似于数学上的函数 y=f(x),"x" 代表 key,"y" 代表 value,key 是无序的、不可重复的,value 是无序的、可重复的,每个键最多映射到一个值。

先来看一下 Collection 接口下面的集合。

List

  • ArrayListObject[] 数组。详细可以查看:ArrayList 源码分析
  • VectorObject[] 数组。
  • LinkedList:双向链表(JDK1.6 之前为循环链表,JDK1.7 取消了循环)。详细可以查看:LinkedList 源码分析

Set

  • HashSet(无序,唯一): 基于 HashMap 实现的,底层采用 HashMap 来保存元素。
  • LinkedHashSet: LinkedHashSetHashSet 的子类,并且其内部是通过 LinkedHashMap 来实现的。
  • TreeSet(有序,唯一): 红黑树(自平衡的排序二叉树)

Queue

  • PriorityQueue: Object[] 数组来实现小顶堆。详细可以查看:PriorityQueue 源码分析
  • DelayQueue:PriorityQueue。详细可以查看:DelayQueue 源码分析
  • ArrayDeque: 可扩容动态双向数组。

Map

  • HashMap:JDK1.8 之前 HashMap 由数组+链表组成的,数组是 HashMap 的主体,链表则是主要为了解决哈希冲突而存在的(“拉链法”解决冲突)。JDK1.8 以后在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为 8)(将链表转换成红黑树前会判断,如果当前数组的长度小于 64,那么会选择先进行数组扩容,而不是转换为红黑树)时,将链表转化为红黑树,以减少搜索时间。详细可以查看:HashMap 源码分析
  • LinkedHashMapLinkedHashMap 继承自 HashMap,所以它的底层仍然是基于拉链式散列结构即由数组和链表或红黑树组成。另外,LinkedHashMap 在上面结构的基础上,增加了一条双向链表,使得上面的结构可以保持键值对的插入顺序。同时通过对链表进行相应的操作,实现了访问顺序相关逻辑。详细可以查看:LinkedHashMap 源码分析
  • Hashtable:数组+链表组成的,数组是 Hashtable 的主体,链表则是主要为了解决哈希冲突而存在的。
  • TreeMap:红黑树(自平衡的排序二叉树)。

怎么选择集合

我们主要根据集合的特点来选择合适的集合。比如:

  • 我们需要根据键值获取到元素值时就选用 Map 接口下的集合,需要排序时选择 TreeMap,不需要排序时就选择 HashMap,需要保证线程安全就选用 ConcurrentHashMap
  • 我们只需要存放元素值时,就选择实现Collection 接口的集合,需要保证元素唯一时选择实现 Set 接口的集合比如 TreeSetHashSet,不需要就选择实现 List 接口的比如 ArrayListLinkedList,然后再根据实现这些接口的集合的特点来选用

为什么要使用集合

当我们需要存储一组类型相同的数据时,数组是最常用且最基本的容器之一。但是,使用数组存储对象存在一些不足之处,因为在实际开发中,存储的数据类型多种多样且数量不确定。这时,Java 集合就派上用场了。与数组相比,Java 集合提供了更灵活、更有效的方法来存储多个数据对象。Java 集合框架中的各种集合类和接口可以存储不同类型和数量的对象,同时还具有多样化的操作方式。相较于数组,Java 集合的优势在于它们的大小可变、支持泛型、具有内建算法等。总的来说,Java 集合提高了数据的存储和处理灵活性,可以更好地适应现代软件开发中多样化的数据需求,并支持高质量的代码编写

List

ArrayList 和 Array(数组)的区别? 

ArrayList 内部基于动态数组实现,比 Array(静态数组) 使用起来更加灵活:

  • ArrayList会根据实际存储的元素动态地扩容或缩容,而 Array 被创建之后就不能改变它的长度了。
  • ArrayList 允许你使用泛型来确保类型安全,Array 则不可以。
  • ArrayList 中只能存储对象。对于基本类型数据,需要使用其对应的包装类(如 Integer、Double 等)。Array 可以直接存储基本类型数据,也可以存储对象。
  • ArrayList 支持插入、删除、遍历等常见操作,并且提供了丰富的 API 操作方法,比如 add()remove()等。Array 只是一个固定长度的数组,只能按照下标访问其中的元素,不具备动态添加、删除元素的能力。
  • ArrayList创建时不需要指定大小,而Array创建时必须指定大小。

下面是二者使用的简单对比

Array

 // 初始化一个 String 类型的数组
 String[] stringArr = new String[]{"hello", "world", "!"};
 // 修改数组元素的值
 stringArr[0] = "goodbye";
 System.out.println(Arrays.toString(stringArr));// [goodbye, world, !]
 // 删除数组中的元素,需要手动移动后面的元素
 for (int i = 0; i < stringArr.length - 1; i++) {
     stringArr[i] = stringArr[i + 1];
 }
 stringArr[stringArr.length - 1] = null;
 System.out.println(Arrays.toString(stringArr));// [world, !, null]

ArrayList

// 初始化一个 String 类型的 ArrayList
 ArrayList<String> stringList = new ArrayList<>(Arrays.asList("hello", "world", "!"));
// 添加元素到 ArrayList 中
 stringList.add("goodbye");
 System.out.println(stringList);// [hello, world, !, goodbye]
 // 修改 ArrayList 中的元素
 stringList.set(0, "hi");
 System.out.println(stringList);// [hi, world, !, goodbye]
 // 删除 ArrayList 中的元素
 stringList.remove(0);
 System.out.println(stringList); // [world, !, goodbye]

ArrayList 和 Vector 的区别?(了解即可)

  • ArrayListList 的主要实现类,底层使用 Object[]存储,适用于频繁的查找工作,线程不安全 。
  • VectorList 的古老实现类,底层使用Object[] 存储,线程安全。
  • List 性能

    • ArrayList:在随机访问元素方面性能非常好,时间复杂度为 O (1),因为它基于数组实现,可以通过索引直接定位元素。但是在中间插入和删除元素时,由于需要移动后续元素,平均时间复杂度为 O (n)(n 为元素个数)。例如,在一个长度为 100 的 ArrayList 的第 50 个位置插入一个元素,后面的 50 个元素都需要依次向后移动一位。
    • LinkedList:在插入和删除操作上,如果操作是在链表头部或尾部进行(比如使用 addFirst ()、addLast ()、removeFirst ()、removeLast () 等方法),时间复杂度为 O (1)。因为只需要修改链表的指针。但在随机访问元素时,需要遍历链表,时间复杂度为 O (n)。例如,要获取 LinkedList 中索引为 50 的元素,需要从链表头开始逐个遍历。
  • Set 性能

    • HashSet:插入、删除和查找操作的平均时间复杂度接近 O (1),这是因为它基于 HashMap 的 key 来存储元素,利用了哈希函数的快速定位能力。但在最坏情况下(哈希冲突严重时),时间复杂度可能会退化为 O (n)。
    • TreeSet:插入、删除和查找操作的时间复杂度为 O (log n),因为红黑树的高度平衡特性保证了操作的对数级复杂度。例如,在一个有 1000 个元素的 TreeSet 中查找一个元素,最多需要比较大约 10 次(log₂1000≈10)。
  • Queue 性能

    • PriorityQueue:插入和删除操作的时间复杂度为 O (log n),因为需要维护小顶堆的结构。例如,插入一个新元素可能会触发堆的调整操作以保证堆的性质。
    • ArrayDeque:在两端进行插入和删除操作的时间复杂度为 O (1),适合实现栈和队列等数据结构。在中间插入和删除操作相对较慢,因为需要移动元素。
  • Map 性能

    • HashMap:和 HashSet 类似,在理想情况下,插入、删除和查找操作的平均时间复杂度接近 O (1)。在 JDK 1.8 中对哈希冲突的优化使得在处理大量数据且存在一定冲突时性能更好。
    • LinkedHashMap:由于额外维护了插入顺序或访问顺序的链表,在插入和遍历操作上比 HashMap 稍慢,但在需要按照特定顺序遍历键值对时非常有用。其查找操作的性能和 HashMap 类似。