計算機程序的思惟邏輯 (49) - 剖析LinkedHashMap

時間 2019-11-17

標籤計算機程序思惟邏輯剖析 linkedhashmap 欄目 Java 简体版

原文原文鏈接

本系列文章經補充和完善，已修訂整理成書《Java編程的邏輯》（馬俊昌著），由機械工業出版社華章分社出版，於2018年1月上市熱銷，讀者好評如潮！各大網店和書店有售，歡迎購買：京東自營連接 html

以前咱們介紹了Map接口的兩個實現類HashMap和TreeMap，本節來介紹另外一個實現類LinkedHashMap。它是HashMap的子類，但能夠保持元素按插入或訪問有序，這與TreeMap按鍵排序不一樣。java

按插入有序容易理解，按訪問有序是什麼意思呢？這兩個有序有什麼用呢？內部是怎麼實現的呢？本節就來探討這些問題。從用法開始。算法

用法

基本概念

LinkedHashMap是HashMap的子類，但內部還有一個雙向鏈表維護鍵值對的順序，每一個鍵值對既位於哈希表中，也位於這個雙向鏈表中。數據庫

LinkedHashMap支持兩種順序，一種是插入順序，另一種是訪問順序。編程

插入順序容易理解，先添加的在前面，後添加的在後面，修改操做不影響順序。瀏覽器

訪問順序是什麼意思呢？所謂訪問是指get/put操做，對一個鍵執行get/put操做後，其對應的鍵值對會移到鏈表末尾，因此，最末尾的是最近訪問的，最開始的最久沒被訪問的，這種順序就是訪問順序。緩存

LinkedHashMap有五個構造方法，其中四個都是按插入順序，以下所示：bash

public LinkedHashMap() public LinkedHashMap(int initialCapacity) public LinkedHashMap(int initialCapacity, float loadFactor) public LinkedHashMap(Map<? extends K, ? extends V> m) 複製代碼

只有一個構造方法，能夠指定按訪問順序，以下所示：微信

public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) 複製代碼

其中參數accessOrder就是用來指定是否按訪問順序，若是爲true，就是訪問順序。網絡

下面，咱們經過一些簡單的例子來看下。

按插入有序

默認狀況下，LinkedHashMap是按插入有序的，咱們來看代碼：

Map<String,Integer> seqMap = new LinkedHashMap<>();

seqMap.put("c", 100);
seqMap.put("d", 200);
seqMap.put("a", 500);
seqMap.put("d", 300);

for(Entry<String,Integer> entry : seqMap.entrySet()){
    System.out.println(entry.getKey()+" "+entry.getValue());
}
複製代碼

鍵是按照"c", "d", "a"的順序插入的，修改"d"的值不會修改順序，因此輸出爲：

c 100
d 300
a 500
複製代碼

何時但願保持插入順序呢？

Map常常用來處理一些數據，其處理模式是，接受一些鍵值對做爲輸入，處理，而後輸出，輸出時但願保持原來的順序。好比一個配置文件，其中有一些鍵值對形式的配置項，但其中有一些鍵是重複的，但願保留最後一個值，但仍是按原來的鍵順序輸出，LinkedHashMap就是一個合適的數據結構。

再好比，但願的數據模型可能就是一個Map，但但願保持添加的順序，好比一個購物車，鍵爲購買項目，值爲購買數量，按用戶添加的順序保存。

另一種常見的場景是，但願Map可以按鍵有序，但在添加到Map前，鍵已經經過其餘方式排好序了，這時，就沒有必要使用TreeMap了，畢竟TreeMap的開銷要大一些。好比，在從數據庫查詢數據放到內存時，可使用SQL的order by語句讓數據庫對數據排序。

按訪問有序

咱們來看按訪問有序的例子，代碼以下：

Map<String,Integer> accessMap = new LinkedHashMap<>(16, 0.75f, true);

accessMap.put("c", 100);
accessMap.put("d", 200);
accessMap.put("a", 500);
accessMap.get("c");
accessMap.put("d", 300);

for(Entry<String,Integer> entry : accessMap.entrySet()){
    System.out.println(entry.getKey()+" "+entry.getValue());
}
複製代碼

每次訪問都會將該鍵值對移到末尾，因此輸出爲：

a 500
c 100
d 300
複製代碼

何時但願按訪問有序呢？一種典型的應用是LRU緩存，它是什麼呢？

LRU緩存

緩存是計算機技術中一種很是有用的技術，是一個通用的提高數據訪問性能的思路，通常用來保存經常使用的數據，容量較小，但訪問更快，緩存是相對而言的，相對的是主存，主存的容量更大、但訪問更慢。緩存的基本假設是，數據會被屢次訪問，通常訪問數據時，都先從緩存中找，緩存中沒有再從主存中找，找到後，再放入緩存，這樣，下次若是再找相同數據，訪問就快了。

緩存用於計算機技術的各個領域，好比CPU裏有緩存，有一級緩存、二級緩存、三級緩存等，一級緩存很是小、很是貴、也很是快，三級緩存則大一些、便宜一些、也慢一些，CPU緩存是相對於內存而言，它們都比內存快。內存裏也有緩存，內存的緩存通常是相對於硬盤數據而言的。硬盤也多是緩存，緩存網絡上其餘機器的數據，好比瀏覽器訪問網頁時，會把一些網頁緩存到本地硬盤。

LinkedHashMap能夠用於緩存，好比緩存用戶基本信息，鍵是用戶Id，值是用戶信息，全部用戶的信息可能保存在數據庫中，部分活躍用戶的信息可能在緩存。

通常而言，緩存容量有限，不能無限存儲全部數據，若是緩存滿了，當須要存儲新數據時，就須要必定的策略將一些老的數據清理出去，這個策略通常稱爲替換算法。LRU是一種流行的替換算法，它的全稱是Least Recently Used，最近最少使用，它的思路是，最近剛被使用的很快再次被用的可能性最高，而最久沒被訪問的很快再次被用的可能性最低，因此被優先清理。

使用LinkedHashMap，能夠很是容易的實現LRU緩存，默認狀況下，LinkedHashMap沒有對容量作限制，但它能夠容易的作的，它有一個protected方法，以下所示：

protected boolean removeEldestEntry(Map.Entry<K,V> eldest) {
    return false;
}
複製代碼

在添加元素到LinkedHashMap後，LinkedHashMap會調用這個方法，傳遞的參數是最久沒被訪問的鍵值對，若是這個方法返回true，則這個最久的鍵值對就會被刪除。LinkedHashMap的實現老是返回false，全部容量沒有限制，但子類能夠重寫該方法，在知足必定條件的狀況，返回true。

下面就是一個簡單的LRU緩存的實現，它有一個容量限制，這個限制在構造方法中傳遞，代碼是：

public class LRUCache<K, V> extends LinkedHashMap<K, V> {
    private int maxEntries;
    
    public LRUCache(int maxEntries){
        super(16, 0.75f, true);
        this.maxEntries = maxEntries;
    }
    
    @Override
    protected boolean removeEldestEntry(Entry<K, V> eldest) {
        return size() > maxEntries;
    }
}    
複製代碼

這個緩存能夠這麼用：

LRUCache<String,Object> cache = new LRUCache<>(3);
cache.put("a", "abstract");
cache.put("b", "basic");
cache.put("c", "call");
cache.get("a");

cache.put("d", "call");
System.out.println(cache);
複製代碼

限定緩存容量爲3，前後添加了4個鍵值對，最久沒被訪問的鍵是"b"，會被刪除，因此輸出爲：

{c=call, a=abstract, d=call}
複製代碼

實現原理

理解了LinkedHashMap的用法，下面咱們來看其實現代碼。關於代碼，咱們說明下，本系列文章，若是沒有額外說明，都是基於JDK 7的。

內部組成

LinkedHashMap是HashMap的子類，內部增長了以下實例變量：

private transient Entry<K,V> header;
private final boolean accessOrder;
複製代碼

accessOrder表示是按訪問順序仍是插入順序。header表示雙向鏈表的頭，它的類型Entry是一個內部類，這個類是HashMap.Entry的子類，增長了兩個變量before和after，指向鏈表中的前驅和後繼，Entry的完整定義爲：

private static class Entry<K,V> extends HashMap.Entry<K,V> {
    Entry<K,V> before, after;

    Entry(int hash, K key, V value, HashMap.Entry<K,V> next) {
        super(hash, key, value, next);
    }

    private void remove() {
        before.after = after;
        after.before = before;
    }

    private void addBefore(Entry<K,V> existingEntry) {
        after  = existingEntry;
        before = existingEntry.before;
        before.after = this;
        after.before = this;
    }

    void recordAccess(HashMap<K,V> m) {
        LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m;
        if (lm.accessOrder) {
            lm.modCount++;
            remove();
            addBefore(lm.header);
        }
    }

    void recordRemoval(HashMap<K,V> m) {
        remove();
    }
}
複製代碼

recordAccess和recordRemoval是HashMap.Entry中定義的方法，在HashMap中，這兩個方法的實現爲空，它們就是被設計用來被子類重寫的，在put被調用且鍵存在時，HashMap會調用Entry的recordAccess方法，在鍵被刪除時，HashMap會調用Entry的recordRemoval方法。

LinkedHashMap.Entry重寫了這兩個方法，在recordAccess中，若是是按訪問順序的，則將該節點移到鏈表的末尾，在recordRemoval中，將該節點從鏈表中移除。

瞭解了內部組成，咱們來看操做方法，先看構造方法。

構造方法

在HashMap的構造方法中，會調用init方法，init方法在HashMap的實現中爲空，也是被設計用來被重寫的。LinkedHashMap重寫了該方法，用於初始化鏈表的頭節點，代碼以下：

void init() {
    header = new Entry<>(-1, null, null, null);
    header.before = header.after = header;
}
複製代碼

header被初始化爲一個Entry對象，前驅和後繼都指向本身，以下圖所示：

header.after指向第一個節點，header.before指向最後一個節點，指向header表示鏈表爲空。

put方法

在LinkedHashMap中，put方法還會將節點加入到鏈表中來，若是是按訪問有序的，還會調整節點到末尾，並根據狀況刪除最久沒被訪問的節點。

HashMap的put實現中，若是是新的鍵，會調用addEntry方法添加節點，LinkedHashMap重寫了該方法，代碼爲：

void addEntry(int hash, K key, V value, int bucketIndex) {
    super.addEntry(hash, key, value, bucketIndex);

    // Remove eldest entry if instructed
    Entry<K,V> eldest = header.after;
    if (removeEldestEntry(eldest)) {
        removeEntryForKey(eldest.key);
    }
}
複製代碼

它先調用父類的addEntry方法，父類的addEntry會調用createEntry建立節點，LinkedHashMap重寫了createEntry，代碼爲：

void createEntry(int hash, K key, V value, int bucketIndex) {
    HashMap.Entry<K,V> old = table[bucketIndex];
    Entry<K,V> e = new Entry<>(hash, key, value, old);
    table[bucketIndex] = e;
    e.addBefore(header);
    size++;
}
複製代碼

新建節點，加入哈希表中，同時加入鏈表中，加到鏈表末尾的代碼是：

e.addBefore(header)
複製代碼

好比，執行以下代碼：

Map<String,Integer> countMap = new LinkedHashMap<>();
countMap.put("hello", 1);
複製代碼

執行後，圖示結構以下：

添加完後，調用removeEldestEntry檢查是否應該刪除老節點，若是返回值爲true，則調用removeEntryForKey進行刪除，removeEntryForKey是HashMap中定義的方法，刪除節點時會調用HashMap.Entry的recordRemoval方法，該方法被LinkedHashMap.Entry重寫了，會將節點從鏈表中刪除。

在HashMap的put實現中，若是鍵已經存在了，則會調用節點的recordAccess方法，LinkedHashMap.Entry重寫了該方法，若是是按訪問有序，則調整該節點到鏈表末尾。

get方法

LinkedHashMap重寫了get方法，代碼爲：

public V get(Object key) {
    Entry<K,V> e = (Entry<K,V>)getEntry(key);
    if (e == null)
        return null;
    e.recordAccess(this);
    return e.value;
}
複製代碼

與HashMap的get方法的區別，主要是調用了節點的recordAccess方法，若是是按訪問有序，recordAccess調整該節點到鏈表末尾。

查看是否包含某個值

查看HashMap中是否包含某個值須要進行遍歷，因爲LinkedHashMap維護了單獨的鏈表，它可使用鏈表進行更爲高效的遍歷，containsValue的代碼爲：

public boolean containsValue(Object value) {
    // Overridden to take advantage of faster iterator
    if (value==null) {
        for (Entry e = header.after; e != header; e = e.after)
            if (e.value==null)
                return true;
    } else {
        for (Entry e = header.after; e != header; e = e.after)
            if (value.equals(e.value))
                return true;
    }
    return false;
}
複製代碼

代碼比較簡單，就不解釋了。

原理小結

以上就是LinkedHashMap的基本實現原理，它是HashMap的子類，它的節點類LinkedHashMap.Entry是HashMap.Entry的子類，LinkedHashMap內部維護了一個單獨的雙向鏈表，每一個節點即位於哈希表中，也位於雙向鏈表中，在鏈表中的順序默認是插入順序，也能夠配置爲訪問順序，LinkedHashMap及其節點類LinkedHashMap.Entry重寫了若干方法以維護這種關係。

LinkedHashSet

以前介紹的Map接口的實現類都有一個對應的Set接口的實現類，好比HashMap有HashSet，TreeMap有TreeSet，LinkedHashMap也不例外，它也有一個對應的Set接口的實現類LinkedHashSet。LinkedHashSet是HashSet的子類，但它內部的Map的實現類是LinkedHashMap，因此它也能夠保持插入順序，好比：

Set<String> set = new LinkedHashSet<>();
set.add("b");
set.add("c");
set.add("a");
set.add("c");

System.out.println(set);
複製代碼

輸出爲：

[b, c, a]
複製代碼

LinkedHashSet的實現比較簡單，咱們就再也不介紹了。

小結

本節主要介紹了LinkedHashMap的用法和實現原理，用法上，它能夠保持插入順序或訪問順序，插入順序常常用於處理鍵值對的數據，並保持其輸入順序，也常常用於鍵已經排好序的場景，相比TreeMap效率更高，訪問順序常常用於實現LRU緩存。實現原理上，它是HashMap的子類，但內部有一個雙向鏈表以維護節點的順序。

最後，咱們簡單介紹了LinkedHashSet，它是HashSet的子類，但內部使用LinkedHashMap。

若是須要一個Map的實現類，而且鍵的類型爲枚舉類型，可使用HashMap，但應該使用一個專門的實現類EnumMap，爲何呢？讓咱們下節來探討。

未完待續，查看最新文章，敬請關注微信公衆號「老馬說編程」(掃描下方二維碼)，深刻淺出，老馬和你一塊兒探索Java編程及計算機技術的本質。用心原創，保留全部版權。