算法圖解之散列表

散列函數

專業術語表述,」將輸入映射到數字」。java

散列函數具備以下要求:
(1)它必須是一致的。
如你輸入blog獲得的是wordpress,那麼每次輸入blog,獲得的都必須爲wordpress。git

(2)它應將不一樣的輸入映射到不一樣的數字。
如,若是一個散列函數無論輸入是什麼都返回1,它就不是好的散列函數。最理想的狀況是,將不一樣的輸入映射到不一樣的數字。

Java中簡單例子(散列表):github

package cn.pratice.simple;

import java.util.Hashtable;

public class HashTableTest {

    public static void main(String[] args) {
        Hashtable<String, String> program = new Hashtable<String,String>();
    
        program.put("JAVA", "高斯林");
        program.put("Python", "龜叔");
        program.put("C++", "本賈尼");
        
        String key = program.get("C++");
        
        System.out.println(key);
        
    }

}

最後控制檯的輸出結果是本賈尼。算法

應用案例

(1)散列表用於查找(DNS解析就用它);數組

(2)防止重複(投票選舉);緩存

(3)將散列表用做緩存;wordpress

衝突

主要體如今:給兩個鍵分配的位置相同。函數

最簡單解決的辦法是:若是兩個鍵映射到了同一個位置,那麼就在這個位置存儲一個鏈表。性能

辦法雖然簡單,可是形成的後果是將會嚴重,主要體現是散列表的速度會很慢。spa

經驗教訓:
(1)散列函數很重要。前面的散列函數將全部的鍵都映射到一個位置,而最理想的狀況是,散列函數將鍵均勻地映射到散列表的不一樣位置。
(2)若是散列表存儲的鏈表很長,散列表的速度將急劇降低。然而,若是使用的散列函數很好,這些鏈表就不會很長。

性能

如圖:

在平均狀況下,散列表執行各類操做的時間都爲O(1)。O(1)被稱爲常量時間。你之前沒有見過常量時間,它並不意味着立刻,而是說無論散列表多大,所需的時間都相同。 比較一下簡單查找、二分查找、散列表的運行時間:

 

 

無論數組多大,從中獲取一個元素所需的時間都是相同的。在平均狀況下,散列表的速度確實很快。

在平均狀況下,散列表的查找(獲取給定索引處的值)速度與數組同樣快,而插入和刪除速度與鏈表同樣快,所以它兼具二者的優勢。可是在最糟的狀況下,散列表的各類操做的速度讀很慢。所以,在使用散列表時,避開最糟的狀況相當重要。爲此,須要避免衝突,而要避免的衝突,須要有:(1)較低的填裝因子;(2)良好的散列函數;

相關文章
相關標籤/搜索