什麼是哈希碼(HashCode)java
在Java中,哈希碼錶明對象的特徵。算法
例如對象 String str1 = 「aa」, str1.hashCode= 3104數組
String str2 = 「bb」, str2.hashCode= 3106數據結構
String str3 = 「aa」, str3.hashCode= 3104ide
根據HashCode由此可得出str1!=str2,str1==str3測試
下面給出幾個經常使用的哈希碼的算法。this
1:Object類的hashCode.返回對象的內存地址通過處理後的結構,因爲每一個對象的內存地址都不同,因此哈希碼也不同。spa
2:String類的hashCode.根據String類包含的字符串的內容,根據一種特殊算法返回哈希碼,只要字符串所在的堆空間相同,返回的哈希碼也相同。設計
3:Integer類,返回的哈希碼就是Integer對象裏所包含的那個整數的數值,例如Integer i1=new Integer(100),i1.hashCode的值就是100 。因而可知,2個同樣大小的Integer對象,返回的哈希碼也同樣。code
HashSet和HashMap一直都是JDK中最經常使用的兩個類,HashSet要求不能存儲相同的對象,HashMap要求不能存儲相同的鍵。
那麼Java運行時環境是如何判斷HashSet中相同對象、HashMap中相同鍵的呢?當存儲了「相同的東西」以後Java運行時環境又將如何來維護呢?
在研究這個問題以前,首先說明一下JDK對equals(Object obj)和hashcode()這兩個方法的定義和規範:
在Java中任何一個對象都具有equals(Object obj)和hashcode()這兩個方法,由於他們是在Object類中定義的。
equals(Object obj)方法用來判斷兩個對象是否「相同」,若是「相同」則返回true,不然返回false。
hashcode()方法返回一個int數,在Object類中的默認實現是「將該對象的內部地址轉換成一個整數返回」。
接下來有兩個個關於這兩個方法的重要規範(我只是抽取了最重要的兩個,其實不止兩個):
規範1:若重寫equals(Object obj)方法,有必要重寫hashcode()方法,確保經過equals(Object obj)方法判斷結果爲true的兩個對象具有相等的hashcode()返回值。說得簡單點就是:「若是兩個對象相同,那麼他們的hashcode應該 相等」。不過請注意:這個只是規範,若是你非要寫一個類讓equals(Object obj)返回true而hashcode()返回兩個不相等的值,編譯和運行都是不會報錯的。不過這樣違反了Java規範,程序也就埋下了BUG。
規範2:若是equals(Object obj)返回false,即兩個對象「不相同」,並不要求對這兩個對象調用hashcode()方法獲得兩個不相同的數。說的簡單點就是:「若是兩個對象不相同,他們的hashcode可能相同」。
根據這兩個規範,能夠獲得以下推論:
一、若是兩個對象equals,Java運行時環境會認爲他們的hashcode必定相等。
二、若是兩個對象不equals,他們的hashcode有可能相等。
三、若是兩個對象hashcode相等,他們不必定equals。
四、若是兩個對象hashcode不相等,他們必定不equals。
這樣咱們就能夠推斷Java運行時環境是怎樣判斷HashSet和HastMap中的兩個對象相同或不一樣了。個人推斷是:先判斷hashcode是否相等,再判斷是否equals。
測試程序以下:首先咱們定義一個類,重寫hashCode()和equals(Object obj)方法
class A { @Override public boolean equals(Object obj) { System.out.println("判斷equals"); return false; } @Override public int hashCode() { System.out.println("判斷hashcode"); return 1; } }
而後寫一個測試類,代碼以下:
public class Test { public static void main(String[] args) { Map<A,Object> map = new HashMap<A, Object>(); map.put(new A(), new Object()); map.put(new A(), new Object()); System.out.println(map.size()); } }
運行以後打印結果是:
判斷hashcode
判斷hashcode
判斷equals
HashCode的做用
首先,想要明白hashCode的做用,你必需要先知道Java中的集合。
總的來講,Java中的集合(Collection)有兩類,一類是List,再有一類是Set。你知道它們的區別嗎?前者集合內的元素是有序的,元素能夠重複;後者元素無序,但元素不可重複。那麼這裏就有一個比較嚴重的問題了:要想保證元素不重複,可兩個元素是否重複應該依據什麼來判斷呢?這就是Object.equals方法了。可是,若是每增長一個元素就檢查一次,那麼當元素不少時,後添加到集合中的元素比較的次數就很是多了。也就是說,若是集合中如今已經有1000個元素,那麼第1001個元素加入集合時,它就要調用1000次equals方法。這顯然會大大下降效率。
因而,Java採用了哈希表的原理。哈希(Hash)其實是我的名,因爲他提出一哈希算法的概念,因此就以他的名字命名了。哈希算法也稱爲散列算法,是將數據依特定算法直接指定到一個地址上。若是詳細講解哈希算法,那須要更多的文章篇幅,我在這裏就不介紹了。初學者能夠這樣理解,hashCode方法實際上返回的就是對象存儲的物理地址(PS:這是一種算法,數據結構裏面有提到。在某一個地址上(對應一個哈希值,該值並不特指內存地址),存儲的是一個鏈表。在put一個新值時,根據該新值計算出哈希值,找到相應的位置,發現該位置已經蹲了一個,則新值就連接到舊值的下面,由舊值指向(next)它(也多是倒過來指。。。)。能夠參考HashMap)。
這樣一來,當集合要添加新的元素時,先調用這個元素的hashCode方法,就一會兒能定位到它應該放置的物理位置上。若是這個位置上沒有元素,它就能夠直接存儲在這個位置上,不用再進行任何比較了;若是這個位置上已經有元素了,就調用它的equals方法與新元素進行比較,相同的話就不存了,不相同就散列其它的地址。因此這裏存在一個衝突解決的問題。這樣一來實際調用equals方法的次數就大大下降了,幾乎只須要一兩次。
因此,Java對於eqauls方法和hashCode方法是這樣規定的:
一、若是兩個對象相同,那麼它們的hashCode值必定要相同;
二、若是兩個對象的hashCode相同,它們並不必定相同
上面說的對象相同指的是用eqauls方法比較。
你固然能夠不按要求去作了,但你會發現,相同的對象能夠出如今Set集合中。同時,增長新元素的效率會大大降低。
怎麼重寫HashCode?
下面介紹如何來重寫hashCode()方法。一般重寫hashCode()方法按如下設計原則實現。
(1)把某個非零素數,例如17,保存在int型變量result中。
(2)對於對象中每個關鍵域f(指equals方法中考慮的每個域)參照如下原則處理。
boolean型,計算(f?0:1)。
byte、char和short型,計算(int)f。
long型,計算(int)(f^(f>>32))。
float型,計算Float.floatToIntBits(f)。
double型,計算Double.doubleToLongBits(f)獲得一個long,再執行long型的處理。
對象引用,遞歸調用它的hashCode()方法。
數組域,對其中的每一個元素調用它的hashCode()方法。
(3)將上面計算獲得的散列碼保存到int型變量c,而後執行result = 37 * result + c。
(4)返回result。
類 HashMap<K,V>
java.lang.Object java.util.AbstractMap<K,V> java.util.HashMap<K,V>
類型參數:
K
- 此映射所維護的鍵的類型
V
- 所映射值的類型
基於哈希表的 Map 接口的實現。此實現提供全部可選的映射操做,並容許使用 null 值和null 鍵。(除了非同步和容許使用 null 以外,HashMap 類與 Hashtable 大體相同。)此類不保證映射的順序,特別是它不保證該順序恆久不變。
HashCode和HashMap之間的關係
先以下代碼:
import java.util.HashMap; public class Test { //重寫Equals不重寫HashCode static class Key { private Integer id; private String value; public Key(Integer id, String value) { super(); this.id = id; this.value = value; } @Override public boolean equals(Object o) { if(o == null || !(o instanceof Key)) { return false; }else { return this.id.equals(((Key)o).id); } } } //重寫Equals也重寫HashCode static class Key_ { private Integer id; private String value; public Key_(Integer id, String value) { super(); this.id = id; this.value = value; } @Override public boolean equals(Object o) { if(o == null || !(o instanceof Key_)) { return false; }else { return this.id.equals(((Key_)o).id); } } @Override public int hashCode() { return id.hashCode(); } } public static void main(String[] args) { //test hashcode HashMap<Object, String> values = new HashMap<Object, String>(5); Test.Key key1 = new Test.Key(1, "one"); Test.Key key2 = new Test.Key(1, "one"); System.out.println(key1.equals(key2)); values.put(key1, "value 1"); System.out.println(values.get(key2)); Test.Key_ key_1 = new Test.Key_(1, "one"); Test.Key_ key_2 = new Test.Key_(1, "one"); System.out.println(key_1.equals(key_2)); System.out.println(key_1 == key_2); values.put(key_1, "value 1"); System.out.println(values.get(key_2)); } }
輸出以下:由上述例子可見:只重寫了equasl方法的Key類 在用作Hash中的鍵值的時候 兩個equasl爲true的對象不能獲取相應 的Value的而重寫了hashCode方法和equals方法的key_類 兩個相等的對象 能夠獲取同一個Value的,這樣更符合生活中 的邏輯HashMap對象是根據Key的hashCode來獲取對應的Vlaue 於是兩個HashCode相同的對象能夠獲取同一個Value
<span style="color:#cc66cc;"> </span>