【Java编程系列】Java8使用List的Stream收集转换成Set,数据却丢失了,你知道为啥吗?

时间:2025-04-04 09:15:03

热门系列:

  •   程序人生,精彩抢先看


1、前言

        前段时间,做业务时。一个列表数据,为了达到去重的效果。然后直接顺手,就用了List的stream流收集器,直接转成Set了。结果上线之后,出现了数据“莫名奇妙的”缺失情况。。。

        于是开始了日志查看情况,最终将问题定位在了类似如下这段代码处:

List<Object> list = new ArrayList<>();
Set<Object> set = ().collect(());

2、正文

        因为,List集合中存储的是对象(Java中万物皆对象,所以这里可以理解成任何类型)。在做Set转换时,疏忽了Set底层的去重比较实现。。而HashSet底层正是使用了HashCode哈希算法来做比较的。所以,即使是多个内容不同的对象,都有可能会是相同的hash值,导致被认为是同一对象来处理!!(反之,2个相同内容的对象,hash值也不一定相等)

        看下面这个例子:

static class Person {
    String name;
    int age;

    public Person(String name, int age) {
         = name;
         = age;
    }

    @Override
    public String toString() {          
        return "Person{" +
                "name='" + name + '\'' +
                ", age=" + age +
                '}';
    }
    
}


public static void main(String[] args) {
    Person p1=new Person("海绵宝宝",18);
    Person p2=new Person("派大星",19);
    Person p3=new Person("蟹老板",20);
    Person p4=new Person("海绵宝宝",18);
    
    Set<Person> p=new HashSet<Person>();
    (p1);
    (p2);
    (p3);
    (p4);     
    
    //先不重写Person的equals和hashCode方法,看下HashSet存储情况
    for (Person ps:p) {
        (ps);
    }
}

        对于我们的业务处理来说,p1和p4这2个对象,按理应该需要做为同1个对象处理的。但是我们看下打印情况:

Person{name='海绵宝宝', age=18}
Person{name='派大星', age=19}
Person{name='海绵宝宝', age=18}
Person{name='蟹老板', age=20}

        明显,p1和p4被当做了2个不同的对象,放进了Set中。所以,此时我们如果需要做去重处理,我们应该需要重写对象的equals()hashCode()方法。

static class Person {
    String name;
    int age;

    public Person(String name, int age) {
         = name;
         = age;
    }

    @Override
    public String toString() {          //打印时输出内容,否则输出地址
        return "Person{" +
                "name='" + name + '\'' +
                ", age=" + age +
                '}';
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != ()) return false;
        Person person = (Person) o;
        return age ==  &&
                (name, );
    }

    @Override
    public int hashCode() {
        return (name, age);
    }
    
}

再执行一下:

Person{name='海绵宝宝', age=18}
Person{name='蟹老板', age=20}
Person{name='派大星', age=19}

我们要的去重效果就达到咯!!!

        所以,回归到本文的问题点上!!!导致数据丢失的情况,则正是因为没有重写equals()hashCode()方法,导致可能有的数据有相同的Hash值,被去重处理掉了。


3、总结

        吃一堑,长一智!以此记录,共勉!!!