java8 HashTable 原理

時間 2019-11-12

標籤 java8 java hashtable 原理欄目 Java 简体版

原文原文鏈接

HashTable原理html

Hashtable是基於陳舊的Dictionary類的，HashMap是Java 1.2引進的Map接口的一個實現。
Hashtable中的方法是同步的，而HashMap方法(在缺省狀況下)是非同步的。node

HashMap原理：http://www.cnblogs.com/zhaojj/p/7805376.html算法

基於jdk1.8數組

1、HashTable類加載
無靜態代碼塊，父類Dictionary也沒有就不談了安全

2、默認構造方法開始數據結構

public Hashtable() {
        this(11, 0.75f);
    }
    public Hashtable(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal Load: "+loadFactor);

        if (initialCapacity==0)
            initialCapacity = 1;
        this.loadFactor = loadFactor;
        table = new Entry<?,?>[initialCapacity];
        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    }
    經過學習hashmap知道，這表示hashtable初始是11的大小，也是0.75的容量比例
    table = new Entry<?,?>[initialCapacity]; 說明初始時已經構建了數據結構是Entry類型的數組，Entry源碼和hashmap基本元素用的node基本是同樣的
    threshold= 11*0.75=8.25 即容量是8
    threshold上限是MAX_ARRAY_SIZE + 1     Integer.MAX_VALUE - 8+1=Integer.MAX_VALUE -7   這個上限根據註釋說明，是由於一些JVM的不一樣限制，爲了防止OutOfMemoryError而進行-8的

3、put方法學習

public synchronized V put(K key, V value) {
        // Make sure the value is not null
        if (value == null) {
            throw new NullPointerException();
        }

        // Makes sure the key is not already in the hashtable.
        Entry<?,?> tab[] = table;
        int hash = key.hashCode();
        int index = (hash & 0x7FFFFFFF) % tab.length;
        @SuppressWarnings("unchecked")
        Entry<K,V> entry = (Entry<K,V>)tab[index];
        for(; entry != null ; entry = entry.next) {
            if ((entry.hash == hash) && entry.key.equals(key)) {
                V old = entry.value;
                entry.value = value;
                return old;
            }
        }

        addEntry(hash, key, value, index);
        return null;
    }
    
    1.synchronized 同步  仍是方法級別的同步，所以效率可想確定不是很高
    2.value==null 拋錯  說明值不能null
    3.int index = (hash & 0x7FFFFFFF) % tab.length;   這個index的算法，看逼格就沒hashmap高啊
        3.1具體0x7FFFFFFF是2 31次冪，即01111111111111111111111111111111   安位與 隨便一個與以後好像沒變化啊，那這句是幹嗎的呢，閒的？咱們要相信大佬們不會閒的沒事寫廢代碼的
            與的做用其實就是第一位0，爲了幹掉負的hash的，-1的hash值就是-1，再%，顯然不能讓出現這個狀況
        3.2    %tab.length就好說了，讓索引落在table內，這種方式相比hashmap的二次hash再異或，效率確定差一些的
    4.for循環  只看這個循環就知道了，數據結構是數組加鏈表了
        主要做用是找當前索引的鏈表上有沒有相同key  又就覆蓋值結束
    5.addEntry(hash, key, value, index);當前索引沒找到相同key，或者壓根索引上就是空的，就在當前索引上加節點

4、addEntry增長節點方法this

private void addEntry(int hash, K key, V value, int index) {
        modCount++;

        Entry<?,?> tab[] = table;
        if (count >= threshold) {
            // Rehash the table if the threshold is exceeded
            rehash();

            tab = table;
            hash = key.hashCode();
            index = (hash & 0x7FFFFFFF) % tab.length;
        }

        // Creates the new entry.
        @SuppressWarnings("unchecked")
        Entry<K,V> e = (Entry<K,V>) tab[index];
        tab[index] = new Entry<>(hash, key, value, e);
        count++;
    }
    1. modCount++;結構變動次數，不談
    2. if (count >= threshold) {  是否擴容的判斷，也是一個主要地方了，看看擴容方案
        2.1 rehash();
        protected void rehash() {
            int oldCapacity = table.length;
            Entry<?,?>[] oldMap = table;

            // overflow-conscious code
            int newCapacity = (oldCapacity << 1) + 1;    說明擴容方案是 擴2倍+1
            if (newCapacity - MAX_ARRAY_SIZE > 0) {        若是擴容後大於最大數組大小，就用最大數組大小
                if (oldCapacity == MAX_ARRAY_SIZE)
                    // Keep running with MAX_ARRAY_SIZE buckets
                    return;
                newCapacity = MAX_ARRAY_SIZE;
            }
            Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];   建立擴容的新數組結構

            modCount++;
            threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);    計算新的容量比例
            table = newMap;    主數組切換到新的數組

            for (int i = oldCapacity ; i-- > 0 ;) {    轉移原結構中數據到新結構中
                for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
                    Entry<K,V> e = old;
                    old = old.next;

                    int index = (e.hash & 0x7FFFFFFF) % newCapacity;
                    e.next = (Entry<K,V>)newMap[index];
                    newMap[index] = e;
                }
            }
        }
        2.2 完成擴容了，須要對本次要添加元素從新計算索引位置
    3.     Entry<K,V> e = (Entry<K,V>) tab[index];
        tab[index] = new Entry<>(hash, key, value, e);
        建立新元素把添加到數組。
        這裏有一個地方要注意到，再有值的狀況下，hashmap是在鏈表末尾掛載新元素的，而這是在鏈表頭也就是數組索引這個位置掛載新元素，一前一後要注意這點

5、其它一些
1.關於2n+1的擴展，在hashtable選擇用取模的方式來進行，那麼儘可能使用素數、奇數會讓結果更加均勻一些，具體證實，能夠看看已經證實這點的技術文章
關於hash，hashmap用2的冪，主要是其還有一個hash過程即二次hash，不是直接用key的hashcode，這個過程打散了數據
整體就是一個減小hash衝突，而且找索引效率還要高，實現都是要考量這兩因素的

6、hashtable已經算是廢棄了
從實現上看，實際hashmap比hashtable改進良多，無論hash方案，仍是結構上多紅黑樹，惟一缺點是非線程安全。
可是hashtable的線程安全機制效率是很是差的，如今能找到很是多的替代方案，好比Collections.synchronizedMap，courrenthashmap等spa

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。