C語言實現一個簡易的Hash table(7)

時間 2019-12-05

標籤 c語言實現一個簡易 hash table 简体版

原文原文鏈接

上一章咱們講了如何根據須要動態設置hash表的大小，在第四章中，咱們使用了雙重哈希來解決hash表的碰撞，其實解決方法有不少，這一章咱們來介紹下其餘方法。segmentfault

本章將介紹兩種解決hash表碰撞的方法：緩存

拉鍊法

使用拉鍊法，每個bucket都會包含一個連接表，當發生碰撞時，就會將該記錄插入在該位置的連接表後面，步驟以下：函數

插入時：經過hash函數獲取到要插入的位置，若是該位置是空的，就直接插入，若是該位置不是空的，就插入在連接表的後面
搜索時：經過hash函數獲取到key對應的位置，遍歷連接表，判斷key是否是搜索的key，若是是，則返回value，不然返回NULL
刪除時：經過hash函數獲取到key對應的位置，遍歷連接表，找到須要刪除的key，若是找到，則將該key對應的記錄從連接表中刪除，若是連接表中只有一條記錄，則將該位置置爲NULL

拉鍊法的優勢是實現起來簡單，可是空間利用率低。每一個記錄必須存儲指向連接表中下一個記錄的指針，若是沒有記錄，則指向NULL，這種方法會浪費一些空間來存儲額外的指針。性能

開放地址法能解決拉鍊法空間利用率低的問題，發生碰撞時，碰撞的記錄將放置在hash表中的其餘bucket中，存放的位置是根據預先肯定的規則選擇的，以便在搜索記錄時能夠重複該規則，有以下幾種規則：spa

當發生碰撞時，就會遞增索引，將記錄插入在下一個可用的索引中，方法以下：指針

線性探測提供了良好的緩存性能，可是存在碰撞後遍歷次數多的問題。將發生碰撞的key放入下一個可用的bucket中可能致使後面插入記錄也要日後插，就須要屢次迭代。code

二次探查法和先行探查相似，不一樣的是，發生碰撞後，咱們會將記錄插入在以下的序列中：i, i + 1, i + 4, i + 9, i + 16, ...，i表明經過hash函數獲取到的索引，具體步驟以下：教程

插入時：經過hash函數找到插入的索引，經過遍歷上面的序列直到找到一個空的或已被刪除的索引位置，執行插入
搜索時：經過hash函數找到key的索引，遍歷上面的序列，將序列上的key與搜索的key對比，若是相等，則返回value，不然返回NULL
刪除時：由於咱們沒法判斷要刪除的項是否是碰撞鏈上的，因此咱們不能直接刪除該條記錄，只能把它標記爲已刪除