先来看能表明hashcode和equals的关系的几句话:
equals()相等的两个对象,hashcode()一定相等;
equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。
反过来:
hashcode()不等,一定能推出equals()也不等;
hashcode()相等,equals()可能相等,也可能不等。
我觉得这样表达两者之间的关系,对程序员来说起不到一点作用,充其量在考试时能做对题目。
我尝试用下边的方法解释两者之间的关系。
首先,应该知道什么是hash表,假如有:10,11,13,14,18,22,27这几个数字,hash算法的目的就是快速的为每个数字分区,存入相应的分区后,以后找起来能更快速。
那么假设hash算法对5取余数,那么数字10,余数0,放在0的位置,数字11,余数1,放在1的位置,其余一次类推。结果如上图所示。
在java中hash算法主要用在集合上,如hashset,hashmap。
我们都知道set有一个特性,就是可与用于过滤相同值的操作,有点类似与SQL中distinct关键字一样。相同的对象,在第2次add进hashset中,由于两次add的是相同的对象,所以,第二次的add未起作用。
如果当前set中已经有1万个不同对象了,那么再添加一个对象时,该怎么判断?判断1万次是否已经含有将要添加到set中的值?显然不会那么做。用什么方法比较才能快速的比较出新添加的数据是不是Set中已经有的数据呢?那么这就用到了hashcode。
再将每一个对象插入hashset之前,首先先算出该对象的hashcode,将要存入hashset的对象只跟具有相同hashcode的元素进行equals比较。此处的hashcode可以对应上图的0,1,2,3,4.
现在依次add3个数字,分别是13,18,27,我们把他们看成3个对象,他们的hashcode都等于3(假设hashcode的算法是数字对5取余的话),所以都应放入3区域,而且他们3个经过equals比较是不相等的,所以3个数字都逐次的存入3区域了。
假如再add一下18的话,首先算hashcode,等于3,然后去3对应的区域将每个元素都用equals比较一遍,显然已经有18了,所以18不再被添加如hashset。这样通过先算出hashcode,然后将要做比较的范围缩小了(再次添加的18,只需和3区域的13、18、27比较),是不是加快速度了呢?
现在,对照图片我们很容易理解文章开头说的那几句话。
1.equals()相等的两个对象,hashcode()一定相等;
两次添加18,他们是相等的对象,肯定能推出hashcode相等,正因为有了hashcode相等这
个事实,所以才有了第2次的18被分配到3区域与原来的18比较的机会。
2.equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。
对照数字13,18,27。
13和18,27是互不相等的对象,但是hashcode却相等