1、初識LinkedHashMapjava
上篇文章講了HashMap。HashMap是一種很是常見、很是有用的集合,但在多線程狀況下使用不當會有線程安全問題。算法
大多數狀況下,只要不涉及線程安全問題,Map基本均可以使用HashMap,不過HashMap有一個問題,就是迭代HashMap的順序並非HashMap放置的順序,也就是無序。HashMap的這一缺點每每會帶來困擾,由於有些場景,咱們期待一個有序的Map。數組
這個時候,LinkedHashMap就閃亮登場了,它雖然增長了時間和空間上的開銷,可是經過維護一個運行於全部條目的雙向鏈表,LinkedHashMap保證了元素迭代的順序。該迭代順序能夠是插入順序或者是訪問順序。緩存
2、四個關注點在LinkedHashMap上的答案安全
關 注 點 | 結 論 |
LinkedHashMap是否容許空 | Key和Value都容許空 |
LinkedHashMap是否容許重複數據 | Key重複會覆蓋、Value容許重複 |
LinkedHashMap是否有序 | 有序 |
LinkedHashMap是否線程安全 | 非線程安全 |
3、LinkedHashMap基本結構數據結構
關於LinkedHashMap,先提兩點:多線程
一、LinkedHashMap能夠認爲是HashMap+LinkedList,即它既使用HashMap操做數據結構,又使用LinkedList維護插入元素的前後順序。app
二、LinkedHashMap的基本實現思想就是----多態。能夠說,理解多態,再去理解LinkedHashMap原理會事半功倍;反之也是,對於LinkedHashMap原理的學習,也能夠促進和加深對於多態的理解。oop
爲何能夠這麼說,首先看一下,LinkedHashMap的定義: 性能
public class LinkedHashMap<K,V> extends HashMap<K,V> implements Map<K,V> { ... }
看到,LinkedHashMap是HashMap的子類,天然LinkedHashMap也就繼承了HashMap中全部非private的方法。再看一下LinkedHashMap中自己的方法:
看到LinkedHashMap中並無什麼操做數據結構的方法,也就是說LinkedHashMap操做數據結構(好比put一個數據),和HashMap操做數據的方法徹底同樣,無非就是細節上有一些的不一樣罷了。
LinkedHashMap只定義了兩個屬性:
/** * The head of the doubly linked list. * 雙向鏈表的頭節點 */ private transient Entry<K,V> header; /** * The iteration ordering method for this linked hash map: true * for access-order, false for insertion-order. * true表示最近最少使用次序,false表示插入順序 */ private final boolean accessOrder;
LinkedHashMap一共提供了五個構造方法:
// 構造方法1,構造一個指定初始容量和負載因子的、按照插入順序的LinkedList public LinkedHashMap(int initialCapacity, float loadFactor) { super(initialCapacity, loadFactor); accessOrder = false; } // 構造方法2,構造一個指定初始容量的LinkedHashMap,取得鍵值對的順序是插入順序 public LinkedHashMap(int initialCapacity) { super(initialCapacity); accessOrder = false; } // 構造方法3,用默認的初始化容量和負載因子建立一個LinkedHashMap,取得鍵值對的順序是插入順序 public LinkedHashMap() { super(); accessOrder = false; } // 構造方法4,經過傳入的map建立一個LinkedHashMap,容量爲默認容量(16)和(map.zise()/DEFAULT_LOAD_FACTORY)+1的較大者,裝載因子爲默認值 public LinkedHashMap(Map<? extends K, ? extends V> m) { super(m); accessOrder = false; } // 構造方法5,根據指定容量、裝載因子和鍵值對保持順序建立一個LinkedHashMap public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) { super(initialCapacity, loadFactor); this.accessOrder = accessOrder; }
從構造方法中能夠看出,默認都採用插入順序來維持取出鍵值對的次序。全部構造方法都是經過調用父類的構造方法來建立對象的。
LinkedHashMap和HashMap的區別在於它們的基本數據結構上,看一下LinkedHashMap的基本數據結構,也就是Entry:
private static class Entry<K,V> extends HashMap.Entry<K,V> { // These fields comprise the doubly linked list used for iteration. Entry<K,V> before, after; Entry(int hash, K key, V value, HashMap.Entry<K,V> next) { super(hash, key, value, next); } ... }
列一下Entry裏面有的一些屬性吧:
一、K key
二、V value
三、Entry<K, V> next
四、int hash
五、Entry<K, V> before
六、Entry<K, V> after
其中前面四個,也就是紅色部分是從HashMap.Entry中繼承過來的;後面兩個,也就是藍色部分是LinkedHashMap獨有的。不要搞錯了next和before、After,next是用於維護HashMap指定table位置上鍊接的Entry的順序的,before、After是用於維護Entry插入的前後順序的。
仍是用圖表示一下,列一下屬性而已:
第一張圖爲LinkedHashMap總體結構圖,第二張圖專門把循環雙向鏈表抽取出來,直觀一點,注意該循環雙向鏈表的頭部存放的是最久訪問的節點或最早插入的節點,尾部爲最近訪問的或最近插入的節點,迭代器遍歷方向是從鏈表的頭部開始到鏈表尾部結束,在鏈表尾部有一個空的header節點,該節點不存放key-value內容,爲LinkedHashMap類的成員屬性,循環雙向鏈表的入口。
4、初始化LinkedHashMap
假若有這麼一段代碼:
1 public static void main(String[] args) 2 { 3 LinkedHashMap<String, String> linkedHashMap = 4 new LinkedHashMap<String, String>(); 5 linkedHashMap.put("111", "111"); 6 linkedHashMap.put("222", "222"); 7 }
首先是第3行~第4行,new一個LinkedHashMap出來,看一下作了什麼:
經過源代碼能夠看出,在LinkedHashMap的構造方法中,實際調用了父類HashMap的相關構造方法來構造一個底層存放的table數組。
1 public LinkedHashMap() { 2 super(); 3 accessOrder = false; 4 }
1 public HashMap() { 2 this.loadFactor = DEFAULT_LOAD_FACTOR; 3 threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR); 4 table = new Entry[DEFAULT_INITIAL_CAPACITY]; 5 init(); 6 }
咱們已經知道LinkedHashMap的Entry元素繼承HashMap的Entry,提供了雙向鏈表的功能。在上述HashMap的構造器中,最後會調用init()方法,進行相關的初始化,這個方法在HashMap的實現中並沒有意義,只是提供給子類實現相關的初始化調用。
LinkedHashMap重寫了init()方法,在調用父類的構造方法完成構造後,進一步實現了對其元素Entry的初始化操做。
1 void init() { 2 header = new Entry<K,V>(-1, null, null, null); 3 header.before = header.after = header; 4 }
這裏出現了第一個多態:init()方法。儘管init()方法定義在HashMap中,可是因爲:
一、LinkedHashMap重寫了init方法
二、實例化出來的是LinkedHashMap
所以實際調用的init方法是LinkedHashMap重寫的init方法。假設header的地址是0x00000000,那麼初始化完畢,其實是這樣的:
注意這個header,hash值爲-1,其餘都爲null,也就是說這個header不放在數組中,就是用來指示開始元素和標誌結束元素的。
header的目的是爲了記錄第一個插入的元素是誰,在遍歷的時候可以找到第一個元素。
5、LinkedHashMap存儲元素
LinkedHashMap並未重寫父類HashMap的put方法,而是重寫了父類HashMap的put方法調用的子方法void recordAccess(HashMap m) ,void addEntry(int hash, K key, V value, int bucketIndex) 和void createEntry(int hash, K key, V value, int bucketIndex),提供了本身特有的雙向連接列表的實現。
繼續看LinkedHashMap存儲元素,也就是put("111","111")作了什麼,首先固然是調用HashMap的put方法:
1 //這個方法應該挺熟悉的,若是看了HashMap的解析的話 2 public V put(K key, V value) { 3 //key爲null的狀況 4 if (key == null) 5 return putForNullKey(value); 6 //經過key算hash,進而算出在數組中的位置,也就是在第幾個桶中 7 int hash = hash(key.hashCode()); 8 int i = indexFor(hash, table.length); 9 //查看桶中是否有相同的key值,若是有就直接用新值替換舊值,而不用再建立新的entry了 10 for (Entry<K,V> e = table[i]; e != null; e = e.next) { 11 Object k; 12 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { 13 V oldValue = e.value; 14 e.value = value; 15 e.recordAccess(this); 16 return oldValue; 17 } 18 } 19 20 modCount++; 21 //上面度是熟悉的東西,最重要的地方來了,就是這個方法,LinkedHashMap執行到這裏,addEntry()方法不會執行HashMap中的方法, 22 //而是執行本身類中的addEntry方法, 23 addEntry(hash, key, value, i); 24 return null; 25 }
第23行又是一個多態,由於LinkedHashMap重寫了addEntry方法,所以addEntry調用的是LinkedHashMap重寫了的方法:
1 void addEntry(int hash, K key, V value, int bucketIndex) { 2 //調用create方法,將新元素以雙向鏈表的的形式加入到映射中 3 createEntry(hash, key, value, bucketIndex); 4 5 // Remove eldest entry if instructed, else grow capacity if appropriate 6 // 刪除最近最少使用元素的策略定義 7 Entry<K,V> eldest = header.after; 8 if (removeEldestEntry(eldest)) { 9 removeEntryForKey(eldest.key); 10 } else { 11 if (size >= threshold) 12 resize(2 * table.length); 13 } 14 }
由於LinkedHashMap因爲其自己維護了插入的前後順序,所以LinkedHashMap能夠用來作緩存,第7行~第9行是用來支持FIFO算法的,這裏暫時不用去關心它。看一下createEntry方法:
1 void createEntry(int hash, K key, V value, int bucketIndex) { 2 HashMap.Entry<K,V> old = table[bucketIndex]; 3 Entry<K,V> e = new Entry<K,V>(hash, key, value, old); 4 table[bucketIndex] = e; 5 //將該節點插入到鏈表尾部 6 e.addBefore(header); 7 size++; 8 }
private void addBefore(Entry<K,V> existingEntry) { after = existingEntry; before = existingEntry.before; before.after = this; after.before = this; }
createEntry(int hash,K key,V value,int bucketIndex)方法覆蓋了父類HashMap中的方法。這個方法不會拓展table數組的大小。該方法首先保留table中bucketIndex處的節點,而後調用Entry的構造方法(將調用到父類HashMap.Entry的構造方法)添加一個節點,即將當前節點的next引用指向table[bucketIndex] 的節點,以後調用的e.addBefore(header)是修改鏈表,將e節點添加到header節點以前。
第2行~第4行的代碼和HashMap沒有什麼不一樣,新添加的元素放在table[i]上,差異在於LinkedHashMap還作了addBefore操做,這四行代碼的意思就是讓新的Entry和原鏈表生成一個雙向鏈表。假設字符串111放在位置table[1]上,生成的Entry地址爲0x00000001,那麼用圖表示是這樣的:
若是熟悉LinkedList的源碼應該不難理解,仍是解釋一下,注意下existingEntry表示的是header:
一、after=existingEntry,即新增的Entry的after=header地址,即after=0x00000000
二、before=existingEntry.before,即新增的Entry的before是header的before的地址,header的before此時是0x00000000,所以新增的Entry的before=0x00000000
三、before.after=this,新增的Entry的before此時爲0x00000000即header,header的after=this,即header的after=0x00000001
四、after.before=this,新增的Entry的after此時爲0x00000000即header,header的before=this,即header的before=0x00000001
這樣,header與新增的Entry的一個雙向鏈表就造成了。再看,新增了字符串222以後是什麼樣的,假設新增的Entry的地址爲0x00000002,生成到table[2]上,用圖表示是這樣的:
就不細解釋了,只要before、after清除地知道表明的是哪一個Entry的就不會有什麼問題。
注意,這裏的插入有兩重含義:
1.從table的角度看,新的entry須要插入到對應的bucket裏,當有哈希衝突時,採用頭插法將新的entry插入到衝突鏈表的頭部。
2.從header的角度看,新的entry須要插入到雙向鏈表的尾部。
總得來看,再說明一遍,LinkedHashMap的實現就是HashMap+LinkedList的實現方式,以HashMap維護數據結構,以LinkList的方式維護數據插入順序。
6、LinkedHashMap讀取元素
LinkedHashMap重寫了父類HashMap的get方法,實際在調用父類getEntry()方法取得查找的元素後,再判斷當排序模式accessOrder爲true時(即按訪問順序排序),先將當前節點從鏈表中移除,而後再將當前節點插入到鏈表尾部。因爲的鏈表的增長、刪除操做是常量級的,故並不會帶來性能的損失。
/** * 經過key獲取value,與HashMap的區別是:當LinkedHashMap按訪問順序排序的時候,會將訪問的當前節點移到鏈表尾部(頭結點的前一個節點) */ public V get(Object key) { // 調用父類HashMap的getEntry()方法,取得要查找的元素。 Entry<K,V> e = (Entry<K,V>)getEntry(key); if (e == null) return null; // 記錄訪問順序。 e.recordAccess(this); return e.value; }
/** * 在HashMap的put和get方法中,會調用該方法,在HashMap中該方法爲空 * 在LinkedHashMap中,當按訪問順序排序時,該方法會將當前節點插入到鏈表尾部(頭結點的前一個節點),不然不作任何事 */ void recordAccess(HashMap<K,V> m) { LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m; //當LinkedHashMap按訪問排序時 if (lm.accessOrder) { lm.modCount++; //移除當前節點 remove(); //將當前節點插入到頭結點前面 addBefore(lm.header); } }
/** * 移除節點,並修改先後引用 */ private void remove() { before.after = after; after.before = before; }
private void addBefore(Entry<K,V> existingEntry) { after = existingEntry; before = existingEntry.before; before.after = this; after.before = this; }
7、利用LinkedHashMap實現LRU算法緩存
前面講了LinkedHashMap添加元素,刪除、修改元素就不說了,比較簡單,和HashMap+LinkedList的刪除、修改元素大同小異,下面講一個新的內容。
LinkedHashMap能夠用來做緩存,比方說LRUCache,看一下這個類的代碼,很簡單,就十幾行而已:
public class LRUCache extends LinkedHashMap { public LRUCache(int maxSize) { super(maxSize, 0.75F, true); maxElements = maxSize; } protected boolean removeEldestEntry(java.util.Map.Entry eldest) { return size() > maxElements; } private static final long serialVersionUID = 1L; protected int maxElements; }
顧名思義,LRUCache就是基於LRU算法的Cache(緩存),這個類繼承自LinkedHashMap,而類中看到沒有什麼特別的方法,這說明LRUCache實現緩存LRU功能都是源自LinkedHashMap的。LinkedHashMap能夠實現LRU算法的緩存基於兩點:
一、LinkedList首先它是一個Map,Map是基於K-V的,和緩存一致
二、LinkedList提供了一個boolean值可讓用戶指定是否實現LRU
那麼,首先咱們瞭解一下什麼是LRU:LRU即Least Recently Used,最近最少使用,也就是說,當緩存滿了,會優先淘汰那些最近最不常訪問的數據。比方說數據a,1天前訪問了;數據b,2天前訪問了,緩存滿了,優先會淘汰數據b。
咱們看一下LinkedList帶boolean型參數的構造方法:
public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) { super(initialCapacity, loadFactor); this.accessOrder = accessOrder; }
就是這個accessOrder,它表示:
(1)false,全部的Entry按照插入的順序排列
(2)true,全部的Entry按照訪問的順序排列
第二點的意思就是,若是有1 2 3這3個Entry,那麼訪問了1,就把1移到尾部去,即2 3 1。每次訪問都把訪問的那個數據移到雙向隊列的尾部去,那麼每次要淘汰數據的時候,雙向隊列最頭的那個數據不就是最不常訪問的那個數據了嗎?換句話說,雙向鏈表最頭的那個數據就是要淘汰的數據。
"訪問",這個詞有兩層意思:
一、根據Key拿到Value,也就是get方法
二、修改Key對應的Value,也就是put方法
首先看一下get方法,它在LinkedHashMap中被重寫:
public V get(Object key) { Entry<K,V> e = (Entry<K,V>)getEntry(key); if (e == null) return null; e.recordAccess(this); return e.value; }
而後是put方法,沿用父類HashMap的:
1 public V put(K key, V value) { 2 if (key == null) 3 return putForNullKey(value); 4 int hash = hash(key.hashCode()); 5 int i = indexFor(hash, table.length); 6 for (Entry<K,V> e = table[i]; e != null; e = e.next) { 7 Object k; 8 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { 9 V oldValue = e.value; 10 e.value = value; 11 e.recordAccess(this); 12 return oldValue; 13 } 14 } 15 16 modCount++; 17 addEntry(hash, key, value, i); 18 return null; 19 }
修改數據也就是第6行~第14行的代碼。看到兩端代碼都有一個共同點:都調用了recordAccess方法,且這個方法是Entry中的方法,也就是說每次的recordAccess操做的都是某一個固定的Entry。
recordAccess,顧名思義,記錄訪問,也就是說你此次訪問了雙向鏈表,我就把你記錄下來,怎麼記錄?把你訪問的Entry移到尾部去。這個方法在HashMap中是一個空方法,就是用來給子類記錄訪問用的,看一下LinkedHashMap中的實現:
void recordAccess(HashMap<K,V> m) { LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m; if (lm.accessOrder) { lm.modCount++; remove(); addBefore(lm.header); } }
private void remove() { before.after = after; after.before = before; }
private void addBefore(Entry<K,V> existingEntry) { after = existingEntry; before = existingEntry.before; before.after = this; after.before = this; }
看到每次recordAccess的時候作了兩件事情:
一、把待移動的Entry的先後Entry相連
二、把待移動的Entry移動到尾部
固然,這一切都是基於accessOrder=true的狀況下。最後用一張圖表示一下整個recordAccess的過程吧:
void recordAccess(HashMap<K,V> m) 這個方法就是咱們一開始說的,accessOrder爲true時,就是使用的訪問順序,訪問次數最少到訪問次數最多,此時要作特殊處理。處理機制就是訪問了一次,就將本身日後移一位,這裏就是先將本身刪除了,而後在把本身添加,這樣,近期訪問的少的就在鏈表的開始,最近訪問的元素就會在鏈表的末尾。若是爲false。那麼默認就是插入順序,直接經過鏈表的特色就能依次找到插入元素,不用作特殊處理。
8、代碼演示LinkedHashMap按照訪問順序排序的效果
最後代碼演示一下LinkedList按照訪問順序排序的效果,驗證一下上一部分LinkedHashMap的LRU功能:
public static void main(String[] args) { LinkedHashMap<String, String> linkedHashMap = new LinkedHashMap<String, String>(16, 0.75f, true); linkedHashMap.put("111", "111"); linkedHashMap.put("222", "222"); linkedHashMap.put("333", "333"); linkedHashMap.put("444", "444"); loopLinkedHashMap(linkedHashMap); linkedHashMap.get("111"); loopLinkedHashMap(linkedHashMap); linkedHashMap.put("222", "2222"); loopLinkedHashMap(linkedHashMap); } public static void loopLinkedHashMap(LinkedHashMap<String, String> linkedHashMap) { Set<Map.Entry<String, String>> set = inkedHashMap.entrySet(); Iterator<Map.Entry<String, String>> iterator = set.iterator(); while (iterator.hasNext()) { System.out.print(iterator.next() + "\t"); } System.out.println(); }
注意這裏的構造方法要用三個參數那個且最後的要傳入true,這樣才表示按照訪問順序排序。看一下代碼運行結果:
111=111 222=222 333=333 444=444 222=222 333=333 444=444 111=111 333=333 444=444 111=111 222=2222
代碼運行結果證實了兩點:
一、LinkedList是有序的
二、每次訪問一個元素(get或put),被訪問的元素都被提到最後面去了