20172328 藍墨雲實驗——三種查找算法練習

20172328 藍墨雲實驗——三種查找算法練習

  • 課程:《軟件結構與數據結構》
  • 班級: 1723
  • 姓名: 李馨雨
  • 學號:20172328
  • 實驗教師:王志強老師
  • 實驗日期:2018年10月19日
  • 必修選修: 必修

1、實驗要求學習內容

  • 查找的關鍵:比較
  • 用平均比較次數來評估算法的優劣,稱爲平均查找長度(ASL)
  • ASL = ∑ p(i)c(i)(i=1,2,3,…,n)
    • 其中P(i)爲查找表中第i個數據元素的機率,C(i)爲找到第i個數據元素時已經比較過的次數.
    • 在查找表中查找不到待查元素,可是找到待查元素應該在表中存在的位置的平均查找次數稱爲查找不成功時的平均查找長度
  • 線性查找算法的ASL:若是每一個關鍵字查找機率相同,則ASL = (n+1)/2;時間複雜度爲O(n)
  • 二分(折半)查找算法的ASL:如圖所示,時間複雜度爲O(log2(n))
    html

  • 分塊(索引順序)算法的ASL:由於分塊查找是先折半查找再線性查找,故假設序列分紅了n塊,每塊k個元素,那麼ASL = LB + LA
    那麼ASL = (1+n)/2 + (1+k)/2
  • 哈希表ASL:哈希表(Hash Table)也叫散列表,是依據關鍵碼值(Key Value)而直接進行訪問的數據結構。它經過把關鍵碼值映射到哈希表中的一個位置來訪問記錄,以加快查找的速度。這個映射函數就作散列函數。存放記錄的數組叫作散列表。前端

  • 查找技術通常基於待查關鍵字和數據項關鍵字的比較,基於關鍵字的比較,其時間複雜度爲O(log2(n)~O(n),而哈希表查找能夠直接經過關鍵字找到存儲地址,使得查找時間能夠是常數級。
  • 哈希表存儲的是鍵值對,其查找的時間複雜度與元素數量多少無關。哈希表在查找元素時是經過計算哈希碼值來定位元素的位置從而直接訪問元素的,所以,哈希表查找的時間複雜度爲O(1)。算法

  • 哈希衝突的處理方法數組

一、開放定址法——線性探測法數據結構

線性探測法的地址增量di = 1, 2, ... , m-1,當中,i爲探測次數。該方法一次探測下一個地址。知道有空的地址後插入。若整個空間都找不到空餘的地址,則產生溢出。函數

線性探測法容易產生「衝突」現象。當表中的第i、i+一、i+2的位置上已經存儲某些keyword,則下一次哈希地址爲i、i+一、i+二、i+3的keyword都將企圖填入到i+3的位置上,這樣的多個哈希地址不一樣的keyword爭奪同一個後繼哈希地址的現象稱爲「衝突」。學習

二、開放地址法——二次探測法.net

二次探測法的地址增量序列爲 di = 12, -12, 22。 -22,… 。 q2, -q2 (q <= m/2)。二次探測能有效避免「彙集」現象,但是不能夠探測到哈希表上所有的存儲單元,但是至少能夠探測到一半。

指針

三、鏈地址法——拉鍊法code

其基本思路是:將所有具備一樣哈希地址的而不一樣keyword的數據元素鏈接到同一個單鏈表中。假設選定的哈希表長度爲m,則可將哈希表定義爲一個有m個頭指針組成的指針數組T[0..m-1]。凡是哈希地址爲i的數據元素,均以節點的形式插入到T[i]爲頭指針的單鏈表中。並且新的元素插入到鏈表的前端,這不只因爲方便。還因爲經常發生這種事實:新近插入的元素最優可能不久又被訪問。

鏈地址法特色:

(1)拉鍊法處理衝突簡單。且無堆積現象,即非同義詞決不會發生衝突,所以平均查找長度較短;
(2)由於拉鍊法中各鏈表上的結點空間是動態申請的。故它更適合於造表前沒法肯定表長的狀況。
(3)開放定址法爲下降衝突。要求裝填因子α較小。故當結點規模較大時會浪費很是多空間。而拉鍊法中可取α≥1,且結點較大時,拉鍊法中添加的指針域可忽略不計,所以節省空間;
(4)在用拉鍊法構造的散列表中,刪除結點的操做易於實現。僅僅要簡單地刪去鏈表上對應的結點就能夠。而對開放地址法構造的散列表,刪除結點不能簡單地將被刪結點的空間置爲空,不然將截斷在它以後填人散列表的同義詞結點的查找路徑。這是因爲各類開放地址法中,空地址單元(即開放地址)都是查找失敗的條件。

所以在用開放地址法處理衝突的散列表上運行刪除操做。僅僅能在被刪結點上作刪除標記,而不能真正刪除結點。

4、哈希表的裝填因子α

裝填因子(α) = (哈希表中的記錄數) / (哈希表的長度)

裝填因子是哈希表裝滿程度的標記因子。值越大。填入表中的數據元素越多,產生衝突的可能性越大。

2、實驗題目及解答過程

給定關鍵字序列11,78,10,1,3,2,4,21,試分別用順序查找、折半查找、散列查找(用線性探查法和鏈地址法)來實現查找。
請畫出他們的對應存儲形式(順序查找的順序表和兩種散列查找的散列表),並求出每一種查找的成功平均查找長度。其中,散列表H(k)= k%11

課堂上作的答案如圖所示:

須要改正的內容是線性探查法部分

  • 對於錯誤的理解:

關於這個問題,讓我對Hash表查找有了更清楚的認識。

首先,咱們是在記錄的存儲地址中查找的,是要在存儲地址和關鍵字序列創建一個肯定的對應關係,這樣經過一次存取就能獲得所查元素的查找方法

其次,衝突也是有順序的,當關鍵值序列一個一個往哈希序列中放的時候,衝突要一個一個解決,而不是把能重複的拋在一邊,最後填完了全部出現的H(k)再去解決衝突。

其餘(感悟、思考等)

第一次寫課堂錯誤改正博客,感受有點開心???哈哈,但願是最後一次啦!不過認識的更加深入啦,也算是好事呀!

4、參考資料

相關文章
相關標籤/搜索