Java基础系列-equals方法和hashCode方法

原创文章，转载请标注出处：《Java基础系列-equals方法和hashCode方法》

概述

equals方法和hashCode方法都是有Object类定义的。

public class Object {
    public native int hashCode();
    public boolean equals(Object obj) {
        return (this == obj);
    }
}

任何的类都是Object类的子类，所有它们默认都拥有这两个方法。
equals方法用于定义两个对象的比较方式，而hashCode方法是native方法，主要用户计算对象的hash值。

equals

equals方法主要用于定义两个对象的比较方式，默认的比较方式是比较内存地址，相对于基本类型来说就是值，而相对于引用类型来说就是堆中具体对象的地址。那么就只有值相同的基本类型，和同一个对象的两个引用才能相等。但是在我们实际业务系统中，两个对象的相等一般指的是两个对象的内容相同（逻辑相同），而不是说它两个是同一个对象，这种情况使用默认的equals就无法实现相等（因为两个不同对象地址值一定不同），这时候我们就需要对equals方法进行重写，定义新的比较方式。

准则

自省性：对于非null的x，存在：x.equals(x)返回true
对称性：对于非null的x和y，存在：x.equals(y)==y.equals(x)
传递性：对于非null的x、y、z，存在：当x.equals(y)返回true，y.equals(z)返回true，则x.equals(z)一定为true
一致性：对于非null的x和y，多次调用x.equals(y)所得的结果是不变的
非空性：对于非null的x，存在x.equals(null)返回false

重写
其实Java中已经为我们展示了如何重equals方法了，最经典的就是String的equals方法：

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    public boolean equals(Object anObject) {
        // 首先判断两个对象是不是同一个，地址相同否
        if (this == anObject) {
            return true;
        }
        // 判断给定的对象是否是String类型，这里instanceof关键字是重写equals方法时经常使用的一个关键字
        // instanseof用于判断右边的类型是否是当前对象的类型或者超类型，超接口类型等
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            // 校验两个字符串的长度相同否
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                // 循环校验两个字符串中的每个字符是否相同
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }
}

注意，使用instanceof在针对存在子类的情况下，可能会出现违反对称性和传递性的情况，为了避免这种情况，可以通给getClass的方式比较类型。
自定义重写：

public class EqualsTest {
    private int id;
    public int getId() {
        return id;
    }
    public void setId(int id) {
        this.id = id;
    }
    @Override
    public boolean equals(Object obj) {
        // 满足非空性
        if(obj == null){
            return false;
        }
        // 满足自省性
        if(this == obj){
            return true;
        }
        // 满足对称性、传递性、一致性
        if(this.getClass() == obj.getClass()
                && this.getClass().getClassLoader() == obj.getClass().getClassLoader()
                && this.id == ((EqualsTest)obj).getId()){
            return true;
        }
        return false;
    }
}

注意：这里如果是有不同的类加载器加载的同一类的实例也是无法相等的。

hashCode

hashCode一般用于计算对象的hash值，它在类重写equals的时候一起重写，重写它的目的是为了保证equals相同的两个对象的hashCode结果一致，为什么要保证这一点呢，那就归结到java中的那几个基于Hash实现的集合上了，比如HashMap、HashSet等，这些集合需要用到对象的hash值来参与计算定位。
使用hashCode的目的就是为了散列元素，最终元素能否散列均匀和hashCode的实现息息相关，即为hash函数。

实现方式

链地址法（理解）：在出现hash冲突的时候，在这个位置再插入新元素，并与原有元素形成一个链表，类似于HashMap的实现方式
开放寻址法（了解）：在出现hash冲突的时候，在当前位置的附近寻找空位来存放新元素，这种方式只需要一种数据结构，不需要引入新的数据结构。其实就是为每个hash结果准备一个探查序列，用来存放发生hash冲突的元素。
- 线性探查法：当出现hash冲突，则在当前位置逐个向后寻找空位，将新元素保存到找到的第一个空位，当找到最后时，需要折返到一开头继续查找。由于探查序列固定，所以会引发一次集群问题。
- 二次探查法：出现冲突，不再逐个顺序探查，而是由某种函数计算的结果序列来探查，这个函数依赖于开始下标的平方，所以叫二次探查，开始下标的不同，序列就不相同，不同序列中会有重复的下标，由于每个下标开始的探查序列是固定的，所以会引发小规模集群，即二次集群问题。
- 双重散列法：要解决群集，就要想办法让相同hash结果的序列不同，最好让序列函数依赖于元素本身，保证当元素不同时，即使hash结果一致，但一旦发生冲突，不同的元素的序列是不同的（因为序列还要依赖元素本身，元素不同，序列结果就会不同），这样存在两个依赖变量的探查方法，可以极大的避免集群问题。
再HASH法（知道）
建立公共溢出区法（知道）

hashCode的实现方式并不是随手而来的，需要考虑各种情况，选择合适的方式来实现，举个例子，在Java的HashMap集合中，采用的就是链地址法来处理hash冲突。

参考：

秒客网

Java基础系列-equals方法和hashCode方法

概述

equals

准则

重写

hashCode

实现方式

相关文章