Java中的集合Set - 入门篇

时间:2022-03-16 20:14:23

前言

大家好啊,我是汤圆,今天给大家带来的是《Java中的集合Set - 入门篇》,希望对大家有帮助,谢谢

简介

前面介绍了集合List映射Map,最后再简单介绍下集合Set,相关类如下图所示

Java中的集合Set - 入门篇

正文

Set从外面看像List(都是存储单一数据的集合),只不过存储的数据不会有重复

但是里面却是Map映射(因为它内存存储是基于Map结构实现),这也是为什么把Set放到Map后面来说的原因。

Set和Map有什么关系呢?

因为Map的键不会有重复,所以Set就利用了Map的这个特点,将其作为内部成员变量来使用

比如我们看下HashSet内部的源码,可以看到,基本上所有操作都是基于其内部的成员变量HashMap进行的


private transient HashMap<E,Object> map;
// 这个常量只是为了适配Map的键值对结构,无实际意义
private static final Object PRESENT = new Object(); public HashSet() {
map = new HashMap<>();
} public int size() {
return map.size();
} public boolean contains(Object o) {
return map.containsKey(o);
} public boolean add(E e) {
return map.put(e, PRESENT)==null;
} public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}

Set的种类

Set的种类类似Map

Set主要有三种类型:HashSet(常用)、TreeSet(树形结构)、LinkedHashSet(前两者的结合)

我们先来看一下Set接口主要的几个方法:

  • boolean add(E e):往Set中添加元素
  • boolean contains(Object o):查询Set是否包含指定对象
  • boolean remove(Object o):从Set中删除指定对象
  • int size():返回Set的元素数量

下面我们简单看下三者的区别

HashSet TreeSet LinkedHashSet
访问速度 适中
元素是否有序 无序 有序,默认升序 有序,默认按插入的顺序
适用场景 为快速查询而设计(用的最多) 需要排序的场景 需要保证查询和插入顺序一致的场景

接下来我们以HashSet为例,来介绍Set接口

HashSet

HashSet是一个无序集合

因为它内部是基于HashMap实现

上面的源码我们有看到,HashSet每插入一个元素,就将该元素作为内部hashMap的key,然后常量Object作为hashMap的value,存储到hashMap中

  • 如果元素的hash值没有重复,就按照数组的方式依次排列;
  • 如果hash值有重复的,就添加到已有的值对后面,形成链表结构;

整体结构 如下图所示

Java中的集合Set - 入门篇

下面用代码示范一下

public class SetDemo {
public static void main(String[] args) {
// 初始化
Set<Integer> set = new HashSet<>();
// 添加元素
set.add(10);
// 元素数量
int size = set.size();
System.out.println(size);
// 查询元素是否存在
boolean isContain = set.contains(10);
System.out.println(set);
// 删除
set.remove(10);
System.out.println(set);
}
}

TreeSet

TreeSet在插入的时候,可以按照元素进行排序(默认升序)

它适合用在排序比较多的场景,性能会比HashSet差一些

下面用代码示范一下(重点要来了)

public class SetDemo {
public static void main(String[] args) { // TreeSet
B b = new B();
// 初始化
Set<B> set2 = new TreeSet<>();
// 添加元素
set2.add(b);
// 元素数量
int size2 = set2.size();
System.out.println(size2);
// 查询元素是否存在
boolean isContain2 = set2.contains(b);
System.out.println(set2);
// 删除
set2.remove(b);
System.out.println(set2);
}
}
class B{ }

这段代码看似一切正常,实则暗藏玄机

如果你运行这段代码,会报出下面的错误提示:类B不能转换为Comparable。

Java中的集合Set - 入门篇

可是为什么要转换呢?我也没有转换啊

那是因为内部自动转换了

TreeSet啥时候会自动将元素类转为Comparable呢?

是在你插入第一个数据开始,内部就已经开始在做比较了(第一次先自己跟自己做比较,目的就是检查你这个数据有没有实现Comparable接口);

后面每插一个数据,都要从根节点开始挨个比较排序

这其实也算也是TreeSet内部排序的工作原理

所以上面这段代码需要让B实现Comparable接口,改后如下所示

public class SetDemo {
public static void main(String[] args) {
// TreeSet
B b = new B();
// 初始化
Set<B> set2 = new TreeSet<>();
// 添加元素
// 此时运行没问题
set2.add(b);
// 元素数量
int size2 = set2.size();
System.out.println(size2);
// 查询元素是否存在
boolean isContain2 = set2.contains(b);
System.out.println(set2);
// 删除
set2.remove(b);
System.out.println(set2);
}
}
// 这里实现了Comparable
class B implements Comparable{
@Override
public int compareTo(Object o) {
return this.hashCode()>o.hashCode() ? 1 : -1;
}
}

此时运行就没问题了

那为什么TreeMap没有这个问题呢?

其实TreeMap也有这个问题,只是TreeMap的键key一般都是字符串或者整型,而字符串和整型对象内部已经实现了Comparable接口,所以问题不大(因为用自定义对象做键key的毕竟还是少数)

LinkedHashSet

LinkedHashSet拥有HashSet的大部分优点,且保证了插入的顺序,使得在查询的时候,可以按照插入的顺序依次读取(原理是链表)

这里要注意一点:在Java程序语言设计中,所有的链表都是双向链表,即每个节点还存放着一个指向前节点的引用

大致的结构图如下所示(之前的LinkedHashMap忘记贴图了,跟这个类似,只是元素内容不同):

Java中的集合Set - 入门篇

三者的排序比较

参考上一篇映射Map,Set排序比较表现出来的行为与Map一致

总结

Set一般用到的有HashSet,TreeSet,LinkedHashSet,内部都是无重复元素

  • HashSet的插入和访问都很快,但是内部是无序排列

  • TreeSet的插入和访问都很慢,但是内部是有序排列,默认按升序排列

  • LinkedHashSet拥有HashSet的大部分优点,而且还可以按照元素插入的顺序来访问元素,但是性能会比HashSet差

后记

最后,感谢大家的观看,谢谢