【百度百科】通配符是一種特殊語句,主要有星號(*)和問號(?),用來模糊搜索文件。當查找文件夾時,可使用它來代替一個或多個真正字符;當不知道真正字符或者懶得輸入完整名字時,經常使用通配符代替一個或多個真正的字符,其中,「?」能夠代替一個字符,而「*」能夠代替零個或多個字符。 java
import java.util.regex.Matcher; import java.util.regex.Pattern; public class StringDemo { //使用正則表達式 通配符匹配字符串 public static boolean isMatching(String src,String des){ String des1 = des.replace("*", "\\w*"); des1 = des1.replace("?", "\\w{1}"); Pattern p = Pattern.compile(des1); Matcher m = p.matcher(src); return m.matches(); } }
對於'?'的處理,只要在匹配的時候將代碼由:if(str1[i]==str2[j]) 改成 if(str1[i]==str2[j] || str2[j]=='?')便可。
對於'*'的處理,能夠將str2根據其中的'*'分爲若干個片斷,而後依次在str1中分別匹配這幾個片斷便可,並且對於這幾個片斷分別匹配,若是第k個片斷在str1中匹配不到,後面也能夠結束了。這裏舉例說明一下:對於str1="Oh year.Totay is weekend!",str2=*ye*a*e*",實際上就是在str1中匹配"ye","a","e"這三個片斷。算法
public static boolean isMatching2(String s, String p) { int i = 0; int j = 0; int starIndex = -1; int iIndex = -1; while (i < s.length()) { if (j < p.length() && (p.charAt(j) == '?' || p.charAt(j) == s.charAt(i))) { ++i; ++j; } else if (j < p.length() && p.charAt(j) == '*') { starIndex = j; iIndex = i; j++;//'*' can match 0 or above 0 characters } else if (starIndex != -1) { //such as "abggggb","*b" //so every time matching starts form the fisrt index of * //can avoid the case above j = starIndex + 1; i = iIndex+1; iIndex++; } else { return false; } } while (j < p.length() && p.charAt(j) == '*') { ++j; } return j == p.length(); }
設主串(下文中咱們稱做T)爲:a b a c a a b a c a b a c a b a a b b併發
模式串(下文中咱們稱做W)爲:a b a c a b編輯器
用暴力算法匹配字符串過程當中,咱們會把T[0] 跟 W[0] 匹配,若是相同則匹配下一個字符,直到出現不相同的狀況,此時咱們會丟棄前面的匹配信息,而後把T[1] 跟 W[0]匹配,循環進行,直到主串結束,或者出現匹配成功的狀況。這種丟棄前面的匹配信息的方法,極大地下降了匹配效率。
T: a b a c a a b a c a b a c a b a a b b
W: a b a c a b
T: a b a c aa b a c a b a c a b a a b b
W: a b a c a b
static boolean isEmpty(final String str) { return str == null || str.isEmpty(); } // str may contain '?' static int[] getNextArray(final String str) { if (isEmpty(str)) { return null; } int[] next = new int[str.length()]; int k = -1; int j = 0; next[0] = -1; while (j < str.length() - 1) { if (k == -1 || str.charAt(k) == str.charAt(j) || str.charAt(k) == '?' || str.charAt(j) == '?') { k++; j++; next[j] = k; } else { k = next[k]; } } return next; } // pattern may contain '?' static int kmpFind(final String str, final String pattern, int start) { if (isEmpty(str)) { return -1; } int[] next = getNextArray(pattern); if (next == null) { return -1; } int i = start; while (i < str.length()) { int j = 0; while (j < pattern.length()) { if (str.charAt(i) == pattern.charAt(j) || pattern.charAt(j) == '?') { i++; j++; } else { break; } } i -= j; if (j == pattern.length()) { return i; } int move = j - next[j]; i += move; } return -1; }
// pattern may contain '*' and '?' // pattern按*分割後,子串裏可能含有?,無法用String.find, 因此針對含?的字符串, // 結合KMP算法,實現了find函數,以後再將pattern按*分割, // 在輸入字符串中按順序查找子串,已實現find含有*和?的字符串 static int find(final String str, final String pattern) { if (isEmpty(str)) { return -1; } if (isEmpty(pattern)) { return -1; } String[] items = pattern.split("\\*"); int i = 0; int ret = -1; for (String s : items) { int index = kmpFind(str, s, i); if (index < 0) { return -1; } if (i == 0) { ret = index; } i = index + s.length(); } return ret; }