如今不少的Java程序員都會把HashMap看成一個熱門話題,今天我也來講一說Hashmap。 程序員
我假設你對HashMap感興趣,另外我認爲你已經瞭解了HashMap的基礎,這裏我就再也不贅述HashMap是個什麼東東. 算法
目錄: 數組
一、一句話回答 數據結構
二、什麼是哈希 app
三、關於Entry類的一點介紹 函數
四、put()方法實際上作了什麼 ui
五、get()方法內部工做機制 this
六、注意點 spa
一句話回答 設計
若是任何人讓我描述一下HashMap的工做機制的話,我就簡單的回答:「基於Hash的規則」。這句話很是簡單,可是要理解這句話以前,首先咱們得了解什麼是哈希,不是麼?
什麼是哈希
哈希簡單的說就是對變量/對象的屬性應用某種算法後獲得的一個惟一的串,用這個串來肯定變量/對象的惟一性。一個正確的哈希函數必須遵照這個準則。
當哈希函數應用在相同的對象或者equal的對象的時候,每次執行都應該返回相同的值。換句話說,兩個相等的對象應該有相同的hashcode。
注:全部Java對象都從Object類繼承了一個默認的hashCode()方法。這個方法將對象在內存中的地址做爲整數返回,這是一個很好的hash實現,他確保了不一樣的對象擁有不一樣的hashcode。
關於Entry類的一點介紹
一個map的定義是:一個映射鍵(key)到值(value)的對象。很是簡單對吧。
因此,在HashMap中必定有必定的機制來存儲這些鍵值對。使得,HashMap有一個內部類Entry,看起來像這樣。
staticclass Entry<K,V>implementsMap.Entry<K,V> { final K key; V value; Entry<K,V> next; finalint hash; ...//More code goes here }
固然,Entry類有屬性用來存儲鍵值對映射。key被final標記,除了key和value,咱們還能看到兩個變量next和hash。接下來咱們試着理解這些變量的含義。
put()方法實際上作了什麼
再進一步看put方法的實現以前,咱們有必要看一看Entry實例在數組中的存儲,HashMap中是這樣定義的:
/** * The table, resized as necessary. Length MUST Always be a power of two. */ transientEntry[] table;
如今再來看put方法的實現。
/** * Associates the specified value with the specified key in this map. * If the map previously contained a mapping for the key, the old * value is replaced. * * @param key key with which the specified value is to be associated * @param value value to be associated with the specified key * @return the previous value associated with <tt>key</tt>, or * <tt>null</tt> if there was no mapping for <tt>key</tt>. * (A <tt>null</tt> return can also indicate that the map * previously associated <tt>null</tt> with <tt>key</tt>.) */ public V put(K key, V value) { if (key == null) returnputForNullKey(value); int hash = hash(key.hashCode()); inti = indexFor(hash, table.length); for (Entry<K,V> e = table[i]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { V oldValue = e.value; e.value = value; e.recordAccess(this); returnoldValue; } } modCount++; addEntry(hash, key, value, i); returnnull; }
讓咱們一步一步的看
首先,檢查key是否爲null,若是key是null值被存在table[0]的位置,由於null的hashcode始終爲0接下來,經過key的hashCode()方法計算了這個key的hash值,這個hash值被用來計算存儲Entry對象的數組中的位置。JDK的設計者假設會有一些人可能寫出很是差的hashCode()方法,會出現一些很是大或者很是小的hash值。爲了解決這個問題,他們引入了另一個hash函數,接受對象的hashCode(),並轉換到適合數組的容量大小。
接着是indexFor(hash,table,length)方法,這個方法計算了entry對象存儲的準確位置。
接下來就是主要的部分,咱們都知道兩個不相等的對象可能擁有過相同的hashCode值,兩個不一樣的對象是怎麼存儲在相同的位置[叫作bucket]呢?
答案是LinkedList。若是你記得,Entry類有一個next變量,這個變量老是指向鏈中的下一個變量,這徹底符合鏈表的特色。
因此,在發生碰撞的時候,entry對象會被以鏈表的形式存儲起來,當一個Entry對象須要被存儲的時候,hashmap檢查該位置是否已近有了一個entry對象,若是沒有就存在那裏,若是有了就檢查她的next屬性,若是是空,當前的entry對象就做爲已經存儲的entry對象的下一個節點,依次類推。
若是咱們給已經存在的key存入另外一個value會怎麼樣的?邏輯上,舊的值將被替換掉。在檢測了Entry對象的存儲位置後,hashmap將會遍歷那個位置的entry鏈表,對每個entry調用equals方法,這個鏈表中的全部對象都具備相同的hashCode()而equals方法都不等。若是發現equals方法有相等的就執行替換。
在這種方式下HashMap就能保證key的惟一性。
get方法的工做機制
如今咱們已經瞭解了HashMap中存儲鍵值對的機制。下一個問題是:怎樣從一個HashMap中查詢結果。
其實邏輯跟put是同樣的,若是傳入的key有匹配就將該位置的value返回,若是沒有就返回null.
/** * Returns the value to which the specified key is mapped, * or {@code null} if this map contains no mapping for the key. * * <p>More formally, if this map contains a mapping from a key * {@code k} to a value {@code v} such that {@code (key==null ? k==null : * key.equals(k))}, then this method returns {@code v}; otherwise * it returns {@code null}. (There can be at most one such mapping.) * * <p>A return value of {@code null} does not <i>necessarily</i> * indicate that the map contains no mapping for the key; it's also * possible that the map explicitly maps the key to {@code null}. * The {@link #containsKeycontainsKey} operation may be used to * distinguish these two cases. * * @see #put(Object, Object) */ public V get(Object key) { if (key == null) returngetForNullKey(); int hash = hash(key.hashCode()); for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) returne.value; } returnnull; }
上面的代碼看起來跟put()方法很像,除了if (e.hash == hash && ((k = e.key) == key || key.equals(k)))。
注意點
存儲Entry對象的數據結構是一個叫作Entry類型的table數組。
數組中一個特定的索引位置稱爲bucket,由於它能夠容納一個LinkedList的第一個元素的對象。
Key對象的hashCode()須要用來計算Entry對象的存儲位置。
Key對象的equals()方法須要用來維持Map中對象的惟一性。
get()和put()方法跟Value對象的hashCode和equals方法無關。
null的hashCode老是0,這樣的Entry對象老是被存儲在數組的第一個位置