Set集合，HashSet类，TreeSet类，EnumSet类

时间：2022-09-29 17:55:23

Set集合通用知识

Set集合与Collection基本上完全一样，没有提供任何额外的方法。实际上Set就是Collection，只是行为不同（Set不允许包含重复元素）

set集合不允许包含相同的元素，如果试图把两个相同元素加入同一个Set集合中，则添加操作失败，add方法返回false，且新元素不会被加入。

问1：Set集合如何判断两个对象是否相同？

答：Set集合判断两个对象是否相同，是使用equals方法，而不是使用运算符==的。即，如果两个对象用equals方法比较返回false，Set就不会接受这两个对象了。

举例如下：

package day0211;

import java.util.HashSet;
import java.util.Set;

public class TestSet1 {

/**
* @param args
* 以下代码看出Set集合只接受同一对象一次出现
* 因为如果Set集合是用==运算符判断两个对象是否相等的话，我们通过new来创建逆战，两次的对象肯定不同，会返回true
* 而结果显示只有一个逆战的字符串，所以Set集合是用equals来比较两个字符串的。
*/
public static void main(String[] args) {
  Set<String> s1 = new HashSet<String>();
  s1.add("周杰伦");
  s1.add("谢霆锋");
  s1.add(new String("逆战"));
  s1.add(new String("逆战"));
  System.out.println(s1);
}
}

运行结果如下：

[周杰伦, 逆战, 谢霆锋]

HashSet类

HashSet类是Set接口的典型实现，大多数时候使用Set集合时就是使用这个实现类的。HashSet按Hash算法来存储集合中的元素，因此具有很到的存取和查找性能。

HashSet具有以下的特点：

①不能保证元素的排列顺序，顺序有可能发生变化

②HashSet不是同步的，即线程不安全的，如果多个线程同时访问一个Set集合，如果有2条或者2条以上线程同时修改了HashSet集合时，必须通过代码来保证其同步。

③集合元素可以是null值，但也只能是一个。

问题1：HashSet几个是如何存储元素的？

答：当向HashSet集合存入一个元素时，HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值，然后根据该HashCode值来决定该对象在HashSet中的存储位置。如果两个元素通过equals方法比较返回true，但是它们的hashCode()方法的返回值不相等，HashSet将会把它们存储在不同位置，也就可以添加成功。

问题2：HashSet集合如何判断两个对象是否相同？

答：HashSet集合判断两个对象是否相同的标准是两个对象通过equa方法比较相等，并且对象的hashCode()方法返回值也相等。

举例如下：

package day0211;

import java.util.HashSet;

public class TestSet2 {

public static void main(String[] args) {
   HashSet hs=new HashSet();
   hs.add(new A());
   hs.add(new A());
   hs.add(new B());
   hs.add(new B());
   hs.add(new C());
   hs.add(new C());
   System.out.println(hs);
}
}

class A {

public boolean equals(Object obj) {
return true;
}

}

class B {

public int hashCode() {
return 1;
}

}

class C {

public boolean equals(Object obj) {
return true;
}
public int hashCode() {
return 2;
}

}

运行结果如下：

[day0211.B@1, day0211.B@1, day0211.A@1bc4459, day0211.C@2, day0211.A@150bd4d]

解释：上面程序中hs集合中分别添加了2个A对象，2个B对象，2个C对象，其中C类重写了equals()方法总是返回true、hashCode()方法总是返回2，这将导致HashSet将会把两个C对象当成同一个对象。

注意点：如果需要把一个对象放入HashSet中时，如果重写该对象的对应类的equals()方法时，也应该重写其hashCode()方法，

其规则是：如果2个对象通过equals方法比较返回true，这两个对象的hashCode也应该相同。

这样就不能添加两个一样的元素了，因为两个对象通过equals方法比较返回true，但这两个对象的hashCode()方法返回不同的hashCode时，将导致HashSet会把这两个对象保存在HashSet的不同位置，从而这两个对象都能添加成功，这与Set集合的规则是相违背的。

相反：如果两个对象的hashCode()方法返回相同的hashCode，但是两个对象通过equals方法比较返回false更加麻烦！因为两个对象的hashCode值相同，HashSet试图将它们保存在同一个位置，但实际上不行。

hash算法：能保证通过一个对象快速查找到另一个对象。可以根据该元素的值得到该元素保存在何处。那么hashCode就是元素的索引。

重写hashCode()方法的基本规则：

①当两个对象通过equals方法比较返回true时，这两个对象的hashCode也应该相等

②对象中用作equals比较标准的属性，都应该用来计算hashCode值

重写hashCode()的方法：

①对象内每个要用作equals()比较标准的属性f，计算出hashCode值。

如果字段是boolean 计算为hashCode=(f?1:0);

如果字段是byte,char,short,int则计算为hashCode=(int)f;

如果字段是long 计算为hashCode=(int)(f^(f>>>32));

如果字段是float 计算为hashCode=Float.floatToLongBits(f);

如果字段是double，计算为

long l=Double.doubleToIntBits(f);

hashCode=(int)(l^(1>>>32));

如果字段是一个引用对象，那么直接调用对象的hashCode方法,即hashCode=f.hashCode()；

如果需要判空，可以加上如果为空就返回0;

②用第一步中计算出来多个hashCode组合计算出一个hashCode值返回。如： return f1.hashCode()+(int)f2;

或者避免直接相加产生偶然情况，可以为各属性乘以任意一个质数后再相加，如： return f1.hashCode()*17+(int)f2*13;

注意：当向HashSet中添加可变对象时，必须十分小心，如果修改了HashSet集合中的对象，有可能导致该对象与集合中其他对象相等，从而导致HashSet无法准确访问该对象。

HashSet还有一个子类LinkedHashSet

LinkedHashSet集合也是根据元素hashCode值来决定元素的存储位置，但它同时使用链表维护元素的次序，这样使得元素看起来是以插入的顺序保存的。也就是遍历LinkedHashSet集合里的元素时，HashSet将会按照元素的添加顺序来访问集合里的元素。

LinkedHashSet与HashSet比较：

前者性能略低于后者，但是迭代访问全部元素时有很好的性能，因为它是以链表来维护内部顺序的。

举例：

package day0211;

import java.util.LinkedHashSet;

public class TestSet3 {

/**
* 以下代码验证了LinkedHashSet集合内的元素的顺序与添加顺序一致
*/
public static void main(String[] args) {
  LinkedHashSet<String> lhs = new LinkedHashSet<String>();
  lhs.add("java");
  lhs.add("andriod");
  lhs.add("c++");
  lhs.add("linux");
  System.out.println("lhs集合内的元素有：" + lhs);
  lhs.remove("c++");
  System.out.println("lhs集合内的元素有：" + lhs);
  lhs.add("c++");
  System.out.println("lhs集合内的元素有：" + lhs);
}
}

运行结果如下：

lhs集合内的元素有：[java, andriod, c++, linux]
lhs集合内的元素有：[java, andriod, linux]
lhs集合内的元素有：[java, andriod, linux, c++]

TreeSet类

TreeSet是SortedSet接口的唯一实现，TreeSet可以确保集合元素处于排序状态。

TreeSet还提供了额外的方法：

Comparator comparator():返回当前Set使用的Comparator,或者返回null，表示以自然方式排序

Object first():返回集合中的第一个元素

Object last():返回集合中的最后一个元素

Object lower(Object e):返回集合中小于指定元素的最大元素

Object higher(Object e):返回集合中大于指定元素的最小元素

SortedSet subSet(fromElement,toElement):返回此Set的子集合，范围从fromElement（包含）到toElement（不包含）。

SortedSet headSet(toElement):返回此Set的子集合，由小于toElement的元素组成

SortedSet tailSet(fromElement):返回此Set的子集合，由大于fromElement的元素组成

举例如下：

package day0211;

import java.util.TreeSet;

public class TestSet4 {

/**
*/
public static void main(String[] args) {
TreeSet<String> ts=new TreeSet<String>();
ts.add("豆豆");
ts.add("胖胖");
ts.add("乐乐");
ts.add("财发");
System.out.println("集合中元素有："+ts);
System.out.println("集合中第一个元素是："+ts.first());
System.out.println("集合中最后一个元素是："+ts.last());
//返回比豆豆小的元素组成的集合
System.out.println(ts.headSet("豆豆"));
//返回大于等于豆豆的元素的新集合
System.out.println(ts.tailSet("豆豆"));
//返回大于胖胖的元素的最小元素
System.out.println(ts.higher("胖胖"));
//返回小于豆豆的元素的最大元素
System.out.println(ts.lower("豆豆"));
//返回从胖胖（包含）到财发（不包含）的元素
System.out.println(ts.subSet("胖胖", "财发"));
}
}

运行结果如下：

集合中元素有：[乐乐, 胖胖, 豆豆, 财发]
集合中第一个元素是：乐乐
集合中最后一个元素是：财发
[乐乐, 胖胖]
[豆豆, 财发]
豆豆
胖胖
[胖胖, 豆豆]

以上结果显示TreeSet并不是根据元素的插入顺序进行排序，而是根据元素实际值来进行排序的。

TreeSet的两种排序方法：自然排序和定制排序，默认情况下，使用自然排序。

自然排序：TreeSet会调用集合元素的comparaTo(Object obj)方法来比较元素之间大小关系，然后将集合元素按升序排列。

comparaTo(Object obj)方法：是定义在Comparable接口中的，该方法返回一个整数值，实现该接口的类必须实现该方法，实现了该接口的类的对象也就可以比较大小了。当一个对象调用该方法与另一个对象进行比较，例如：obj1.compareTo(obj2)，如果该方法返回0，则表明这两个对象相等，如果该方法返回一个正整数，则表明obj1大于obj2；如果该方法返回一个负整数，则表明obj1小于obj2。

java的一些常用类已经实现了Comparable接口，并提供比较大小的标准。如下是已经实现的常用类：

BigDecimal、BigInteger以及所有数值型对应包装类：按它们对应的数值的大小进行比较。

Character：按字符的UNICODE值进行比较。

Boolean：true对应的包装类实例大于false对应的包装类实例。

String：按字符串中字符的UNICODE值进行比较。

Date、Time：后面的时间、日期比前面的时间、日期大。

如果试图把一个对象添加进TreeSet时，则该对象的类必须实现Comparable接口，否则程序将会跑出异常。

例子：

package day0211;

import java.util.TreeSet;

class F {

}

public class TestSet5 {

/**
* 上面的程序试图向TreeSet集合添加两个A()对象，添加第一个对象时，TreeSet里没有任何元素，所以不会出现问题；
* 当添加第二个A()对象时，TreeSet就会调用该对象的compareTo(Object obj)方法与几个中其他元素进行比较，
* 如果其对应的类（即例子中的A类）没有实现Comparable接口，就会引发ClassCastException异常。
*/

public static void main(String[] args) {
TreeSet ts = new TreeSet();
ts.add(new F());

//会报错
// ts.add(new F());
System.out.println("集合中元素有：" + ts);

}
}

运行结果会报错！Exception in thread "main" java.lang.ClassCastException: day0211.F cannot be cast to java.lang.Comparable
at java.util.TreeMap.put(TreeMap.java:542)
at java.util.TreeSet.add(TreeSet.java:238)
at day0211.TestSet5.main(TestSet5.java:12)

注意点1：上面的程序试图向TreeSet集合添加两个A()对象，添加第一个对象时，TreeSet里没有任何元素，所以不会出现问题；当添加第二个A()对象时，TreeSet就会调用该对象的compareTo(Object obj)方法与几个中其他元素进行比较，如果其对应的类（即例子中的A类）没有实现Comparable接口，就会引发ClassCastException异常。

注意点2：大部分类在实现compareTo(Object obj)方法，都需要将被比较对象obj强制类型转换成相同类型，因为只有相同类的两个实例才会比较大小。比如：当试图将一个对象添加到TreeSet集合中，TreeSet会调用该对象的compareTo(Object obj)方法与集合中其他元素进行比较，这就要求集合中其他元素与该元素是同一个类的实例，即向TreeSet中添加的应该是同一个类的对象，否则会也会引发ClassCastException异常。

举例：

package day0211;

import java.util.TreeSet;

public class TestSet6 {

public static void main(String[] args) {
  TreeSet ts = new TreeSet();
  ts.add(new String("豆豆"));
  //以下代码报错，类型不一致
  //ts.add(new Date());
}
}

问题：TreeSet集合如何判断两个对象不相等？

答：标准是两个对象通过equals方法比较返回false，或者通过compareTo(Object obj)比较没有返回0（返回0，表示两个对象相等），即使两个对象是同一个对象，TreeSet也会把它当成两个对象进行处理。

注意：当需要把一个对象放入TreeSet时，重写该对象对应类的equals()方法时，要保证该方法与compareTo(Object obj)方法有一致的结果；

其规则是：如果两个对象通过equals方法比较返回true时，这两个对象通过compareTo(Object obj)方法比较应该返回0。

如果两个对象通过equals方法比较返回true时，但是这两个对象通过compareTo(Object obj)方法比较不返回0时，会导致TreeSet将这两个对象保存在不同的位置，从而两个都被添加成功，这与Set集合的规则有出入。

相反：当两个对象通过compareTo(Object obj)方法比较应该返回0时，但两个对象通过equals方法比较返回false更麻烦！因为两个对象通过compareTo(Object obj)方法比较相同，TreeSet试图将它们保存在同一个位置，但实际上不行。

注意：注意：当向TreeSet中添加可变元素的属性，必须十分小心，当试图删除该对象时， TreeSet在处理这些对象时将很容易出错

故：在HashSet和TreeSet 集合只推荐仿佛不可变对象！

定制排序：如果需要实现定制排序，例如以降序排序，则可以使用Comparator接口的帮助。该接口里包含一个int compare(T o1，T o2)方法，该方法用于比较o1和o2的大小，如果该方法返回正整数，则表明o1大于o2；如果该方法返回0，则表明o1等于o2；如果该方法返回负整数，则表明o1小于o2。如果需要实现定制排序，则需要在创建TreeSet集合对象时，并提供一个Comparator对象与该TreeSet集合关联，由该Comparator对象负责集合元素的排序逻辑。

EnumSet类

EnumSet是一个专为枚举类设计的集合类，EnumSet中所有值都必须是指定枚举类型的枚举值，该枚举类型在创建EnumSet时显示或隐式的指定。EnumSet的集合元素也是有序的，EnumSet以枚举值在Enum类内的定义顺序来决定集合元素的顺序。

注意点：

1.EnumSet集合不允许加入null元素。如果试图插入，将抛出异常。如果仅仅只是试图测试是否出现null元素或删除null元素都不会抛出异常，删除操作会返回false

2.EnumSet类没有暴露任何构造器来创建该类的实例，程序应该通过它提供的static方法来创建EnumSet对象：

一些常用static方法来创建EnumSet对象：

static EnumSet allof(Class elementType):创建一个包含指定枚举类里所有枚举值的EnumSet es4对象。

static EnumSet complementOf(EnumSet s):创建一个其元素类型与指定EnumSet里的元素类型相同的EnumSet，新的EnumSet集合包含原EnumSet集合所不包含的、此枚举类剩下的枚举值（即新的EnumSet集合和原来的EnumSet集合的集合元素加起来就是该枚举类的所有枚举值）

static EnumSet copyOf(Collection c):使用一个普通集合来创建EnumSet集合

static EnumSet copyOf(EnumSet s):创建一个与指定EnumSet具有相同元素类型、相同集合元素的EnumSet。

static EnumSet noneOf(Class elementType):创建一个元素类型为指定枚举类型的空EnumSet.

static EnumSet of(E first,E...rest):创建一个包含一个或多个枚举值的EnumSet，传入的多个枚举值必须属于同一个枚举类。

static EnumSet range(E from,E to):创建包含从from枚举值，到to枚举值范围内所有枚举值的EnumSet集合。

举例如下：

package day0212;

import java.util.Collection;
import java.util.EnumSet;
import java.util.HashSet;

enum Season
{
SPRING,SUNMMER,FALL,WINTER
}

public class TestEnumSet {

public static void main(String[] args) {
  EnumSet es1=EnumSet.allOf(Season.class);
  System.out.println("集合es1中的元素包括："+es1);
  EnumSet es2=EnumSet.noneOf(Season.class);
  System.out.println("集合es2中的元素包括："+es2);
  es2.add(Season.SUNMMER);
  es2.add(Season.SPRING);
  System.out.println("集合es2中的元素包括："+es2);
  EnumSet es3=EnumSet.of(Season.SUNMMER, Season.WINTER);
  System.out.println("集合es3中的元素包括："+es3);
  EnumSet es4=EnumSet.range(Season.SUNMMER, Season.WINTER);
  System.out.println("集合es4中的元素包括："+es4);
  EnumSet es5=EnumSet.complementOf(es4);
  System.out.println("集合es5中的元素包括："+es5);

  Collection   c1=new HashSet();
  System.out.println("集合c1中的元素包括："+c1);
  c1.add(Season.SPRING);
  c1.add(Season.WINTER);
  EnumSet es6=EnumSet.copyOf(c1);
  System.out.println("集合c1中的元素包括："+c1);
  System.out.println("集合es6中的元素包括："+es6);
  /**
   * 以下代码会报错当EnumSet集合中的所有元素是由Collection集合中复制而来的时候，
   * 要求Collection集合中的元素是同一个枚举类的枚举值。
   */
// c1.add("你好");
// EnumSet es7=EnumSet.copyOf(c1);
// System.out.println("集合c1中的元素包括："+c1);
// System.out.println("集合es7中的元素包括："+es7);

}

}

运行结果如下：

集合es1中的元素包括：[SPRING, SUNMMER, FALL, WINTER]
集合es2中的元素包括：[]
集合es2中的元素包括：[SPRING, SUNMMER]
集合es3中的元素包括：[SUNMMER, WINTER]
集合es4中的元素包括：[SUNMMER, FALL, WINTER]
集合es5中的元素包括：[SPRING]
集合c1中的元素包括：[]
集合c1中的元素包括：[SPRING, WINTER]
集合es6中的元素包括：[SPRING, WINTER]

总结如下：

1. HashSet和TreeSet是Set两个典型实现，如何选择 HashSet和TreeSet呢？

答：HashSet的性能总是比TreeSet好，因为TreeSet额外要维护集合元素的次序，只有当需要一个保持排序的Set时，才使用TreeSet，否则都应该使用HashSet。

2.HashSet还有一个子类：LinkedHashSet，对于普通插入、删除操作，LinkedHashSet比HashSet要略微慢点，这是由于维护链表所带来的额外开销造成的，不过，因为有了链表，遍历LinkedHashSet会更快。

3.EnumSet是所有Set实现类中性能最好的，但是它只能保存同一个枚举类的枚举值作为集合元素。

4.Set的三个实现类HashSet、TreeSet、EnumSet都是线程不安全的。如果有多条线程同时访问一个Set集合，并且超过一条线程修改了该Set集合，必须手动保证Set集合的同步性。通常使用Collections工具类的synchronizedSortedSet方法来“包装”该Set集合，此操作最好在创建时进行。例如：SortedSet s=Collections.synchronizedSortedSet(new TreeSet(...));

标签：集合 set tree hash enum

相关文章

