+貪婪匹配與非貪婪匹配java
貪婪匹配
默認狀況下,正則表達式使用最長匹配原則(也叫貪婪匹配原則)。
例如:要將"zoom"中匹配"zo?"的部 分替換成"r",替換的的結果是"rom"。若是要將"zoom"中匹配"zo*" 的部分替換成"r",替換後的結果是"rm"。正則表達式
非貪婪匹配
當字符?緊隨其餘限定符(*、+、?、{n}、{n,}、{n,m})以後時,匹配模式變成了最短匹配原則(也 叫非貪婪匹配原則)。
例如:在字符串"fooood"中,"fo+?"只匹配"fo"部分,而"fo+"匹配"foooo部分。code
當正則表達式中包含能接受重複的限定符時,一般的行爲是(在使整個表達式能獲得匹配的前提下)匹配儘量多的字符。以這個表達式爲例:a.*b,它將會匹配最長的以a開始,以b結束的字符串。若是用它來搜索aabab的話,它會匹配整個字符串aabab。這被稱爲貪婪匹配。字符串
有時,咱們更須要懶惰匹配,也就是匹配儘量少的字符。前面給出的限定符均可以被轉化爲懶惰匹配模式,只要在它後面加上一個問號?。這樣.*?就意味着匹配任意數量的重複,可是在能使整個匹配成功的前提下使用最少的重複。如今看看懶惰版的例子吧:it
a.*?b 匹配最短的,以a開始,以b結束的字符串。若是把它應用於aabab的話,它會匹配aab和abclass
.*跟.*?的區別搜索
.*?匹配點前面的字符到問號後面字符最短的匹配,而.*則匹配到最後一個能匹配到的co
例子一、:匹配字符
<li title="中國人" name="外國人">中國人中國人</li>
正則以下:由於是匹配第一個雙引號到接下來的雙引號結束,不然若是用.*的話這個li有多個屬性就一直匹配到最後一個屬性的結束了ab
<li title=\"(.*?)\">([^<]*)</li>