貪婪和非貪婪

時間 2019-11-19

標籤貪婪简体版

原文原文鏈接

貪婪匹配：當正則表達式中包含能接受到重複的限定符時，一般的行爲是匹配儘量多的字符，這中匹配方式叫作貪婪匹配。特徵是一次性讀入整個字符串經行匹配，每當不匹配就捨棄最右邊一個字符，繼續匹配，依次匹配和捨棄，直到匹配成功或者把整個字符串捨棄爲止，所以它是一種最大化數據返回，能多不會少。

前面咱們講太重複限定符，其實這些限定符就是貪婪量詞，好比表達式：\d{3,6}正則表達式

用來匹配3到6位數字，在這種狀況下，它是一種貪婪模式匹配，也就是假如字符串裏有6個數字匹配，那它就會所有匹配到。spa

String test = "61762828 176 2991 871";
    String reg = "\\d{3,6}";
    Pattern pattern = Pattern.compile(reg);
    Matcher mc = pattern.matcher(test);
    while (mc.find()) {
        System.out.println("匹配結果:" + mc.group());
    }
    // 匹配結果:617628
    // 匹配結果:176
    // 匹配結果:2991
    // 匹配結果:871

由結果可見：原本字符串中的「61762828」這一段，其實只須要出現「617」就已經匹配成功了，但它並不知足，而是匹配到了最大能匹配的字符，也就是6個。code

那麼有人會問，若是多個貪婪量詞湊在一塊兒，那他們是如何支配本身的匹配權的呢？blog

是這樣的，多個貪婪在一塊兒時，若是字符串能知足他們各自最大程度的匹配時，就互不干擾，但若是不能知足時，會根據深度優先的原則，也就是從左到右的每個貪婪量詞，優先最大數量的知足，剩餘再分配下一個量詞匹配。字符串

String test = "61762828 176 2991 87321";
    String reg = "(\\d{1,2})(\\d{3,4})";
    Pattern pattern = Pattern.compile(reg);
    Matcher mc = pattern.matcher(test);
    while (mc.find()) {
        System.out.println("匹配結果:" + mc.group());
    }
    // 匹配結果:617628
    // 匹配結果:2991
    // 匹配結果:87321

「617628」是前面的\d{1,2}匹配出了61，後面的匹配出了7628table

"2991" 是前面的\d{1,2}匹配出了29 ，後面的匹配出了91class

"87321"是前面的\d{1,2}匹配出了87，後面的匹配出了321test

懶惰（非貪婪）

懶惰匹配：當正則表達式中包含能接受重複的限定符時，一般的行爲是匹配儘量少的字符，這種匹配方式叫作懶惰匹配。特性：從左到右，從字符串的最左邊開始匹配，每次試圖不讀入字符匹配，匹配成功，則完成匹配，不然讀入一個字符再匹配，依次循環（讀入字符，匹配）直到匹配成功或者把字符串的字符匹配完爲止。循環

代碼	說明
*？	重複任意次，但儘量少重複
+？	重複1次或更屢次，但儘量少重複
？？	重複0次或1次，但儘量少重複
{n,m}?	重複n到m次，但儘量少重複
{n,}?	重複n次以上，但儘量少重複

String reg = "(\\d{1,2}?)(\\d{3,4})";
    String test = "61762828 176 2991 87321";
    System.out.println("文本：" + test);
    System.out.println("貪婪模式：" + reg);
    Pattern p1 = Pattern.compile(reg);
    Matcher m1 = p1.matcher(test);
    while (m1.find()) {
        System.out.println("匹配結果：" + m1.group(0));
    }
    // 文本：61762828 176 2991 87321
    // 貪婪模式：(\d{1,2}?)(\d{3,4})
    // 匹配結果：61762
    // 匹配結果：2991
    // 匹配結果：87321

「61762」是左邊的懶惰匹配出6，右邊的貪婪匹配出1762
"2991" 是左邊的懶惰匹配出2，右邊的貪婪匹配出991
"87321" 左邊的懶惰匹配出8，右邊的貪婪匹配出7321數據

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。