【重學數據結構與算法(JS)】字符串匹配算法(四)——Sunday算法

前言

慣例,最重要的匹配思路仍是要貼一遍:算法

  1. 模式串主串進行比較segmentfault

    • 從前日後比較
    • 從後往前比較
  2. 匹配時,比較主串模式串的下一個位置
  3. 失配時,數據結構

    • 模式串中尋找一個合適的位置框架

      • 若是找到,從這個位置開始與主串當前失配位置進行比較
      • 若是未找到,從模式串的頭部與主串失配位置的下一個位置進行比較
    • 主串中找到一個合適的位置,從新與模式串進行比較

Sunday算法也許是三種裏面最好理解也最好寫的一種了,它的思路也是在於失配時如何跳過儘量多的字符,具體的說,主要是優化了第3步,失配時,在主串中找到一個合適的位置,從新與模式串進行比較優化

算法介紹與分析

  • 主串模式串的首位開始比較,記spa

    • 主串 S
    • 模式串 P
    • 主串長度 slen
    • 模式串長度 plen
    • 主串位置指針 i
    • 模式串位置指針 j
    • 每次從新匹配時,模式串尾部對應主串位置的下一位 m
  • 判斷 S[i]P[j] 是否相等3d

    • 若是相等指針

      • 判斷 jplen-1 是否相等,若是相等則表示 表示模式串匹配完成,直接返回 i - j 便可
      • 若是不相等,則繼續比較下一位,即 i++;j++;
    • 若是不相等code

      • 查看 S[m] 字符是否存在於 P 中,若是存在,將 P 移至兩字符對應的位置上
      • 若是不存在,則移至 S[m] 的後一位
  • 若是移動後, m > slen ,說明 S 已經遍歷一遍,仍然沒有找到目標,模式串 匹配失敗。

栗子

初始狀態,i = 0, j = 0, m = 4blog

QQ20200123-205626.png


比較 S[0]P[0],發現不相等,看 S[4] 處發現並無在 P 中出現

QQ20200123-205718.png


直接將 P 移至 S[4] 的後一位,此時 i = 5, j = 0, m = 9

QQ20200123-205913.png


比較 S[5]P[0],發現不相等,看 S[9] 處發現有在 P 中出現

QQ20200123-210136.png


P 中的 iS 中的 i 對齊,此時 i = 8, j = 0, m = 12

QQ20200123-210415.png


比較 S[8]P[0],發現不相等,看 S[12] 處發現並無在 P 中出現

QQ20200123-210651.png


直接將 P 移至 S[12] 的後一位,此時 i = 13, j = 0, m = 17

QQ20200123-210854.png


比較 S[13]P[0],發現不相等,看 S[17] 處發現有在 P 中出現

QQ20200123-211050.png


P 中的 nS 中的 n 對齊,此時 i = 15, j = 0, m = 18

QQ20200123-211352.png


繼續匹配,直到 j === plen - 1 = 3,則匹配成功,獲得結果 i - j = 18 - 3 = 15

QQ20200123-211750.png

代碼實現

極端狀況的排除

carbon.png

總體邏輯框架

  • 首先,確定有一個循環,先找到終結條件,和 BF算法 同樣,查找順序也是從前日後,能夠很快知道,i < slen 就是終結的條件
  • 其次,就是要對匹配和失配進行不一樣的處理

由此,咱們就能夠寫出總體的框架:

carbon的副本.png

細節的完善

carbon的副本2.png

總結

Sunday算法 遵循匹配思路,失配時採起本身的優化策略,也儘量的移動了最多的步數,達到提升效率的目的,且易理解。

後記

「字符串匹配算法」是「重學數據結構與算法」系列筆記:

相關文章
相關標籤/搜索