哈希表心得

時間 2020-01-18

標籤哈希心得简体版

原文原文鏈接

最近我在作一個項目，其中要用到一個數據結構——Hash Table（哈希表），之前只有理論知識，如今實卻發現很不簡單，因此寫下來和你們共分享。

咱們知道，哈希表是一個固定大小的數組，數組的每一個元素是一個鏈表（單向或雙向）的頭指針。若是Key同樣，則在一塊兒，若是Key不同，則不在一塊兒。哈希表的查詢是飛快的。由於它不須要從頭搜索，它利用Key的「哈希算法」直接定位，查找很是快，各類數據庫中的數據結構基本都是它。但帶來的問題是，哈希表的尺寸、哈希算法。

哈希表的數組是定長的，若是太大，則浪費，若是過小，體現不出效率。合適的數組大小是哈希表的性能的關鍵。哈希表的尺寸最好是一個質數，最小的質數尺寸是17。

固然，根據不一樣的數據量，會有不一樣的哈希表的大小。對於數據量很時多時少的應用，最好的設計是使用動態可變尺寸的哈希表，那麼若是你發現哈希表尺寸過小了，好比其中的元素是哈希表尺寸的2倍時，咱們就須要擴大哈希表尺寸，通常是擴大一倍。下面的數庫是哈希表變化尺寸時尺寸大小的一個列表。

static int prime_array[] = {
    17,             /* 0 */
    37,             /* 1 */
    79,             /* 2 */
    163,            /* 3 */
    331,            /* 4 */
    673,            /* 5 */
    1361,           /* 6 */
    2729,           /* 7 */
    5471,           /* 8 */
    10949,          /* 9 */
    21911,          /* 10 */
    43853,          /* 11 */
    87719,          /* 12 */
    175447,         /* 13 */
    350899,         /* 14 */
    701819,         /* 15 */
    1403641,        /* 16 */
    2807303,        /* 17 */
    5614657,        /* 18 */
    11229331,       /* 19 */
    22458671,       /* 20 */
    44917381,       /* 21 */
    89834777,       /* 22 */
    179669557,      /* 23 */
    359339171,      /* 24 */
    718678369,      /* 25 */
    1437356741,     /* 26 */
    2147483647      /* 27 (largest signed int prime) */
};

#define PRIME_ARRAY_SIZE (28)

要使用哈希表，就必定要用一個哈希算法，來肯定KEY值，這彷佛是個很難的事，下面是一個哈希算法：

typedef struct _hTab{
    hLinks* link;    /* 一個鏈表 */
    int  num;     /* 成員個數 */
    int  size;    /* 表的尺寸 */
} hTab;

static unsigned int
getHashIndex(hTab *tabPtr, const char *key)
{
    unsigned int ha = 0;

    while (*key)
        ha = (ha * 128 + *key++) % tabPtr->size;

return ha;

}

（其中key是一個字符串，hTab就是一個哈希表結構, tabPtr->size是哈希表數組的大小）

這個算法被實施證實是比較不錯的，可以達到分散數據的效果，若是你有更好的算法，歡迎和我交流。（ [email]litmouse@km169.net[/email]）

———— （版權全部，如需轉載，請註明出處及做者）