Java中的equals 和 hashcode 方法

時間 2019-11-12

原文原文鏈接

Java中的集合（Collection）有兩類，一類是List，再有一類是Set。前者集合內的元素是有序的，元素能夠重複；後者元素無序，但元素不可重複。算法

那麼這裏就有一個比較嚴重的問題了：要想保證元素不重複，可兩個元素是否重複應該依據什麼來判斷呢？ 函數

這就是Object.equals方法了。可是，若是每增長一個元素就檢查一次，那麼當元素不少時，後添加到集合中的元素比較的次數就很是多了。也就是說，若是集合中如今已經有1000個元素，那麼第1001個元素加入集合時，它就要調用1000次equals方法。這顯然會大大下降效率。編碼

因而，Java採用了哈希表的原理。哈希（Hash）其實是我的名，因爲他提出一哈希算法的概念，因此就以他的名字命名了。哈希算法也稱爲散列算法，是將數據依特定算法直接指定到一個地址上。初學者能夠這樣理解，hashCode方法實際上返回的就是對象存儲的物理地址（實際可能並非）。

這樣一來，當集合要添加新的元素時，先調用這個元素的hashCode方法，就一會兒能定位到它應該放置的物理位置上。若是這個位置上沒有元素，它就能夠直接存儲在這個位置上，不用再進行任何比較了；若是這個位置上已經有元素了，就調用它的equals方法與新元素進行比較，相同的話就不存了，不相同就散列其它的地址。因此這裏存在一個衝突解決的問題。這樣一來實際調用equals方法的次數就大大下降了，幾乎只須要一兩次。設計

因此，Java對於eqauls方法和hashCode方法是這樣規定的： code

一、若是兩個對象相同，那麼它們的hashCode值必定要相同；對象

二、若是兩個對象的hashCode相同，它們並不必定相同（上面說的對象相同指的是用eqauls方法比較。）內存

你固然能夠不按要求去作了，但你會發現，相同的對象能夠出如今Set集合中。同時，增長新元素的效率會大大降低。 md5

hashcode這個方法是用來鑑定2個對象是否相等的。那你會說，不是還有equals這個方法嗎？不錯，這2個方法都是用來判斷2個對象是否相等的。可是他們是有區別的。通常來說，equals這個方法是給用戶調用的，若是你想判斷2個對象是否相等，你能夠重寫equals方法，而後在代碼中調用，就能夠判斷他們是否相等了。簡單來說，equals方法主要是用來判斷從表面上看或者從內容上看，2個對象是否是相等。

舉個例子，有個學生類，屬性只有姓名和性別，那麼咱們能夠認爲只要姓名和性別相等，那麼就說這2個對象是相等的。 hashcode方法通常用戶不會去調用，好比在hashmap中，因爲key是不能夠重複的，他在判斷key是否是重複的時候就判斷了hashcode 這個方法，並且也用到了equals方法。這裏不能夠重複是說equals和hashcode只要有一個不等就能夠了！因此簡單來說，hashcode相當因而一個對象的編碼，就好像文件中的md5，他和equals不一樣就在於他返回的是int型的，比較起來不直觀。咱們通常在覆蓋equals的同時也要覆蓋hashcode，讓他們的邏輯一致。舉個例子，仍是剛剛的例子，若是姓名和性別相等就算2個對象相等的話，那麼hashcode的方法也要返回姓名的hashcode值加上性別的hashcode值，這樣從邏輯上，他們就一致了。要從物理上判斷2個對象是否相等，用==就能夠了。開發

在Java語言中，equals()和hashCode()兩個函數的使用是緊密配合的，你要是本身設計其中一個，就要設計另一個。在多數狀況下，這兩個函數是不用考慮的，直接使用它們的默認設計就能夠了。可是在一些狀況下，這兩個函數最好是本身設計，才能確保整個程序的正常運行。最多見的是當一個對象被加入收集對象（collection object）時，這兩個函數必須本身設計。更細化的定義是：若是你想將一個對象A放入另外一個收集對象B裏，或者使用這個對象A爲查找一個元對象在收集對象B裏位置的鑰匙，並支持是否容納，刪除收集對象B裏的元對象這樣的操做，那麼，equals()和hashCode()函數必須開發者本身定義。其餘情況下，這兩個函數是不須要定義的。 hash

equals():

它是用於進行兩個對象的比較的，是對象內容的比較，固然也能用於進行對象參閱值的比較。什麼是對象參閱值的比較？就是兩個參閱變量的值得比較，咱們都知道參閱變量的值其實就是一個數字，這個數字能夠當作是鑑別不一樣對象的代號。兩個對象參閱值的比較，就是兩個數字的比較，兩個代號的比較。這種比較是默認的對象比較方式，在Object這個對象中，這種方式就已經設計好了。因此你也不用本身來重寫，浪費沒必要要的時間。

對象內容的比較纔是設計equals()的真正目的，Java語言對equals()的要求以下，這些要求是必須遵循的。不然，你就不應浪費時間：

•對稱性：若是x.equals(y)返回是「true」，那麼y.equals(x)也應該返回是「true」。

•反射性：x.equals(x)必須返回是「true」。

•類推性：若是x.equals(y)返回是「true」，並且y.equals(z)返回是「true」，那麼z.equals(x)也應該返回是「true」。

•還有一致性：若是x.equals(y)返回是「true」，只要x和y內容一直不變，無論你重複x.equals(y)多少次，返回都是「true」。

•任何狀況下，x.equals(null)，永遠返回是「false」；x.equals(和x不一樣類型的對象)永遠返回是「false」。

hashCode():
這個函數返回的就是一個用來進行哈希操做的整型代號，請不要把這個代號和前面所說的參閱變量所表明的代號弄混了。後者不只僅是個代號還具備在內存中才查找對象的位置的功能。hashCode()所返回的值是用來分類對象在一些特定的收集對象中的位置。這些對象是HashMap, Hashtable, HashSet，等等。這個函數和上面的equals()函數必須本身設計，用來協助HashMap, Hashtable, HashSet，等等對本身所收集的大量對象進行搜尋和定位。

這些收集對象究竟如何工做的，想象每一個元對象hashCode是一個箱子的編碼，按照編碼，每一個元對象就是根據hashCode()提供的代號納入相應的箱子裏。全部的箱子加起來就是一個HashSet，HashMap，或 Hashtable對象，咱們須要尋找一個元對象時，先看它的代碼，就是hashCode()返回的整型值，這樣咱們找到它所在的箱子，而後在箱子裏，每個元對象都拿出來一個個和咱們要找的對象進行對比，若是兩個對象的內容相等，咱們的搜尋也就結束。這種操做須要兩個重要的信息，一是對象的 hashCode()，還有一個是對象內容對比的結果。

hashCode()的返回值和equals()的關係以下：

•若是x.equals(y)返回「true」，那麼x和y的hashCode()必須相等。

•若是x.equals(y)返回「false」，那麼x和y的hashCode()有可能相等，也有可能不等。

爲何這兩個規則是這樣的，緣由其實很簡單，拿HashSet來講吧，HashSet能夠擁有一個或更多的箱子，在同一個箱子中能夠有一個或更多的獨特元對象（HashSet所容納的必須是獨特的元對象）。這個例子說明一個元對象能夠和其餘不一樣的元對象擁有相同的hashCode。可是一個元對象只能和擁有一樣內容的元對象相等。因此這兩個規則必須成立。

設計這兩個函數所要注意到的：
若是你設計的對象類型並不使用於收集性對象，那麼沒有必要本身再設計這兩個函數的處理方式。這是正確的面向對象設計方法，任何用戶一時用不到的功能，就先不要設計，以避免給往後功能擴展帶來麻煩。

若是你在設計時想別出心裁，不遵照以上的兩套規則，那麼勸你仍是不要作這樣想入非非的事。我尚未遇到過哪個開發者和我說設計這兩個函數要違背前面說的兩個規則，我碰到這些違反規則的狀況時，都是做爲設計錯誤處理。

當一個對象類型做爲收集型對象的元對象時，這個對象應該擁有本身處理equals()，和/或處理hashCode()的設計，並且要遵照前面所說的兩種原則。equals()先要查null和是不是同一類型。查同一類型是爲了不出現ClassCastException這樣的異常給丟出來。查 null是爲了不出現NullPointerException這樣的異常給丟出來。

若是你的對象裏面容納的數據過多，那麼這兩個函數 equals()和hashCode()將會變得效率低。若是對象中擁有沒法serialized的數據，equals()有可能在操做中出現錯誤。想象一個對象x，它的一個整型數據是transient型（不能被serialize成二進制數據流）。然而equals()和hashCode()都有依靠這個整型數據，那麼，這個對象在serialization以前和以後，是否同樣？不同。由於serialization以前的整型數據是有效的數據，在serialization以後，這個整型數據的值並無存儲下來，再從新由二進制數據流轉換成對象後，二者（對象在serialization 以前和以後）的狀態已經不一樣了。這也是要注意的。