Java基础系列-equals方法和hashCode方法

时间:2021-04-01 16:50:30

原创文章,转载请标注出处:《Java基础系列-equals方法和hashCode方法》

概述

        equals方法和hashCode方法都是有Object类定义的。

public class Object {
    public native int hashCode();
    public boolean equals(Object obj) {
        return (this == obj);
    }
}

        任何的类都是Object类的子类,所有它们默认都拥有这两个方法。
        equals方法用于定义两个对象的比较方式,而hashCode方法是native方法,主要用户计算对象的hash值。

equals

        equals方法主要用于定义两个对象的比较方式,默认的比较方式是比较内存地址,相对于基本类型来说就是值,而相对于引用类型来说就是堆中具体对象的地址。那么就只有值相同的基本类型,和同一个对象的两个引用才能相等。但是在我们实际业务系统中,两个对象的相等一般指的是两个对象的内容相同(逻辑相同),而不是说它两个是同一个对象,这种情况使用默认的equals就无法实现相等(因为两个不同对象地址值一定不同),这时候我们就需要对equals方法进行重写,定义新的比较方式。

准则

  • 自省性:对于非null的x,存在:x.equals(x)返回true
  • 对称性:对于非null的x和y,存在:x.equals(y)==y.equals(x)
  • 传递性:对于非null的x、y、z,存在:当x.equals(y)返回true,y.equals(z)返回true,则x.equals(z)一定为true
  • 一致性:对于非null的x和y,多次调用x.equals(y)所得的结果是不变的
  • 非空性:对于非null的x,存在x.equals(null)返回false

    重写

            其实Java中已经为我们展示了如何重equals方法了,最经典的就是String的equals方法:
public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    public boolean equals(Object anObject) {
        // 首先判断两个对象是不是同一个,地址相同否
        if (this == anObject) {
            return true;
        }
        // 判断给定的对象是否是String类型,这里instanceof关键字是重写equals方法时经常使用的一个关键字
        // instanseof用于判断右边的类型是否是当前对象的类型或者超类型,超接口类型等
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            // 校验两个字符串的长度相同否
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                // 循环校验两个字符串中的每个字符是否相同
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }
}

        注意,使用instanceof在针对存在子类的情况下,可能会出现违反对称性和传递性的情况,为了避免这种情况,可以通给getClass的方式比较类型。
        自定义重写:

public class EqualsTest {
    private int id;
    public int getId() {
        return id;
    }
    public void setId(int id) {
        this.id = id;
    }
    @Override
    public boolean equals(Object obj) {
        // 满足非空性
        if(obj == null){
            return false;
        }
        // 满足自省性
        if(this == obj){
            return true;
        }
        // 满足对称性、传递性、一致性
        if(this.getClass() == obj.getClass()
                && this.getClass().getClassLoader() == obj.getClass().getClassLoader()
                && this.id == ((EqualsTest)obj).getId()){
            return true;
        }
        return false;
    }
}

        注意:这里如果是有不同的类加载器加载的同一类的实例也是无法相等的。

hashCode

        hashCode一般用于计算对象的hash值,它在类重写equals的时候一起重写,重写它的目的是为了保证equals相同的两个对象的hashCode结果一致,为什么要保证这一点呢,那就归结到java中的那几个基于Hash实现的集合上了,比如HashMap、HashSet等,这些集合需要用到对象的hash值来参与计算定位。
        使用hashCode的目的就是为了散列元素,最终元素能否散列均匀和hashCode的实现息息相关,即为hash函数。

实现方式

  • 链地址法(理解):在出现hash冲突的时候,在这个位置再插入新元素,并与原有元素形成一个链表,类似于HashMap的实现方式
  • 开放寻址法(了解):在出现hash冲突的时候,在当前位置的附近寻找空位来存放新元素,这种方式只需要一种数据结构,不需要引入新的数据结构。其实就是为每个hash结果准备一个探查序列,用来存放发生hash冲突的元素。
    • 线性探查法:当出现hash冲突,则在当前位置逐个向后寻找空位,将新元素保存到找到的第一个空位,当找到最后时,需要折返到一开头继续查找。由于探查序列固定,所以会引发一次集群问题。
    • 二次探查法:出现冲突,不再逐个顺序探查,而是由某种函数计算的结果序列来探查,这个函数依赖于开始下标的平方,所以叫二次探查,开始下标的不同,序列就不相同,不同序列中会有重复的下标,由于每个下标开始的探查序列是固定的,所以会引发小规模集群,即二次集群问题。
    • 双重散列法:要解决群集,就要想办法让相同hash结果的序列不同,最好让序列函数依赖于元素本身,保证当元素不同时,即使hash结果一致,但一旦发生冲突,不同的元素的序列是不同的(因为序列还要依赖元素本身,元素不同,序列结果就会不同),这样存在两个依赖变量的探查方法,可以极大的避免集群问题。
  • 再HASH法(知道)
  • 建立公共溢出区法(知道)

        hashCode的实现方式并不是随手而来的,需要考虑各种情况,选择合适的方式来实现,举个例子,在Java的HashMap集合中,采用的就是链地址法来处理hash冲突。

        参考: