回顧散列表的7點

1.散列表(hash table)的實現成爲散列(hashing),是一種以常數平均時間執行輸入、刪除和查找的技術。可是那些須要元素間任何排序信息的數操做將不會獲得有效的支持。算法

2.散列函數示例bash

int hash(const string & key, int tableSize)
{
    int hashVal=0;
    for(int i=0;i<key.length();i++)
        hashVal=37*hashVal+key[i];
    hashVal %= tableSize;
    if(hashVal<0)
        hashVal+=tableSize;
    return hashVal;

3.散列表是由鍵值對來提供動力的,所以若是在值相同而鍵不一樣的狀況下就會發生衝突。那麼解決衝突的辦法,有一種叫作分離連接法(separate chaining),它將散列到同一個值得全部元素都保留到一個鏈表中。markdown

這裏寫圖片描述

分離連接散列表的類構架:數據結構

template <typename HashedObj>
class HashTable
{
public:
    explicit HashTable(int size=101);
    bool contains(const HashedObj & x) const;

    void makeEmpty();
    void insert(const HashedObj & x);
    void remove(const HashedObj & x);

private:
    vector<list<HashedObj>> theLists;
    int currentSize;

    void rehash();
    int myhash(const HashedObj & x) const;
};

int hash(const string & key);
int hash(int key);
int myhash(const HashedObj & x) const
{
    int hashVal=hash(x);
    hashVal %= theLists.size();
    if(hashVal<0)
        hashVal+=theLists.size();
    return hashVal;
}

4.分離連接散列表的insert函數函數

bool insert(const HashedObj & x)
{
    list<HashedObj> & whichList=theLists[myhash(x)];
    if(find(whichList.begin(),whichList.end(),x)!=whichList.end())
        return false;
    whichList.push_back(x);

    if(++currentSize>theLists.size())
        rehash();
    return true;
}

5.分離連接散列表算法的缺點是使用了一些鏈表,因爲給新單元分配地址須要時間,所以這就致使算法的速度有些減慢,同時算法實際上還要求第二種數據結構的實現。所以探測散列表就應運而生。它又包含了3種探測方式。性能

線性探測ui

這裏寫圖片描述

這裏寫圖片描述

平方探測spa

這裏寫圖片描述

雙散列.net

這裏寫圖片描述

6.若是散列表已經不足以來存放你的數據,那麼能夠考慮使用可擴散列(extendible hashing)。code

這裏寫圖片描述

這裏寫圖片描述

這裏寫圖片描述

7.對於分散連接散列法,雖然裝填因子不大時性能並不明顯下降,但裝填因子仍是應該接近於1.對於探測散列,除非徹底不可避免,不然裝填因子不該該超過0.5.若是用線性探測,那麼性能隨着裝填因子接近於1而急速降低。再擴散運算能夠經過使表增加和收縮來保持合理的裝填因子。


歡迎你們點擊左上角的「關注」或右上角的「收藏」方便之後閱讀。


爲使本文獲得斧正和提問,轉載請註明出處:
http://blog.csdn.net/nomasp

相關文章
相關標籤/搜索