Java容器(六):从容器出发探讨hashCode和equals

时间:2022-04-01 16:49:04

一、容器中的hashcode和euqals

  Java容器框架中有List和Set,其中List允许有重复元素,而Set则不允许有重复元素,Set是如何处理这里重复元素的?肯定是与equals相关,通过迭代来equals()是否相等,但是当数据量大的时候,假如我们往HashSet中添加10000个元素,equals()10000次,效率岂不是很低?我们来看看HashSet是如何实现的

    public V put(K key, V value) {
//如果key为空的情况
if (key == null)
return putForNullKey(value);
//计算key的hash值
int hash = hash(key);
//计算该hash值在table中的下标
int i = indexFor(hash, table.length);
//对table[i]存放的链表进行遍历
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
//判断该条链上是否有hash值相同的(key相同)
//若存在相同,则直接覆盖value,返回旧value
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}

//修改次数+1
modCount++;
//把当前key,value添加到table[i]的链表中
addEntry(hash, key, value, i);
return null;
}

HashSet内部是使用HashMap来实现的

当调用set.add(1),实际上set在内部把添加的值1当做key,把空的object对象当做value,使用内部的map添加该key-value

  当我们往HashMap中添加一个key-value时,首先会为key计算一个hash值,然后通过该hash值求得该key应该在哈希表的哪个索引位置,然后对该位置的链表进行遍历,如果不存在与该key对应的hash值,则存入;如果存在和key相同的hash值,就调用equals方法来匹配这两个元素是否相同。

  从上面可以看到,Set其实是通过hashcode来减少了euqals的次数,从而提升效率,也就是说hashcode和euqals是紧密联系的。

二、hashCode和equals

  在Effective Java中的第8条和第9条中分别提到了对equals和hashCode的规则
  
  对于euqals应该遵守如下约定:
  1、自反性:x.equals(x) 必须为true
  2、对称性:如果x.equals(y),则y.euqals(x)必须为true
  3、传递性:如果x.equals(y)返回是“true”,而且y.equals(z)返回是“true”,那么z.equals(x)也应该返回是“true”
  4、一致性:如果x.equals(y)返回是“true”,只要x和y内容一直不变,不管你重复x.equals(y)多少次,返回都是“true”
  5、任何情况下,x.equals(null),永远返回是“false”;x.equals(和x不同类型的对象)永远返回是“false”
  6、覆盖equals时总是要覆盖hashCode

  对于hashCode应该遵守如下约定:
  1、在一个应用程序执行期间,如果一个对象的equals方法做比较所用到的信息没有被修改的话,则对该对象调用hashCode方法多次,它必须始终如一地返回同一个整数。
  2、如果两个对象根据equals(Object o)方法是相等的,则调用这两个对象中任一对象的hashCode方法必须产生相同的整数结果。
  3、如果两个对象根据equals(Object o)方法是不相等的,则调用这两个对象中任一个对象的hashCode方法,不要求产生不同的整数结果。但如果能不同,则可能提高散列表的性能。

  总结:
  1、如果x.equals(y)返回“true”,那么x和y的hashCode()必须相等。
  2、如果x.equals(y)返回“false”,那么x和y的hashCode()有可能相等,也有可能不等。

三、举例

class Student{
int age;
int sex;
String name;

public Student(int age, int sex, String name) {
super();
this.age = age;
this.sex = sex;
this.name = name;
}

//省略get和set方法

@Override
public int hashCode() {
System.out.println("调用了hashCode方法...");

int hashResult = 1;
hashResult = (hashResult + Integer.valueOf(age).hashCode() + name.hashCode()) * 99;
System.out.println("name:"+name +" hashCode:" + hashResult);

return hashResult;
}

@Override
public boolean equals(Object obj) {
System.out.println("调用了equals方法...");

if(obj == null)
return false;
if(obj == this)
return true;
if(obj.getClass() != this.getClass())
return false;

Student p = (Student) obj;
if(getAge() != p.getAge() || getSex() != p.getSex())
return false;
if(getName() != null){
if(!getName().equals(p.getName()))
return false;
}
return true;
}
}

public class Equals1 {

public static void main(String[] args){
Student p1 = new Student(1, 1, "张飞");
Student p2 = new Student(2, 1, "关羽");
Student p3 = new Student(1, 1, "张飞");
Student p4 = new Student(1, 1, "关羽");

System.out.println("p1==p3 : " + (p1 == p3));
System.out.println("p1.equals(p3) : " + (p1.equals(p3)));

System.out.println();
HashSet<Student> set = new HashSet<Student>();
set.add(p1);
set.add(p2);
set.add(p3);
set.add(p4);
System.out.println("set.size : " + set.size());
}
}

结果如下:

p1==p3 : false
调用了equals方法...
p1.equals(p3) : true

调用了hashCode方法...
name:张飞 hashCode:78610752
调用了hashCode方法...
name:关羽 hashCode:67229415
调用了hashCode方法...
name:张飞 hashCode:78610752
调用了equals方法...
调用了hashCode方法...
name:关羽 hashCode:67229316
set.size : 3

  分析:
  1、p1 和 p3 的属性相同,但是他们指向不同的对象,所以p1==p3为false
  2、p1 和 p3 虽然指向不同的对象,但属性相同,因此equals返回true
  3、Student类覆盖了hashCode和equals方法,且hashcode值通过类的age和name属性来求得,p1 和 p3 具有相同的属性,当增加p3时,由于hashcode相同,因此会调用equals,最后发现值相同,所以去除重复