正則表達式簡單記錄

clip_image001clip_image003

下面是一個更復雜的表達式:\(?0\d{2}[) -]?\d{8}。html

這個表達式能夠匹配幾種格式的電話號碼,像(010)88886666,或022-22334455,或02912345678等。咱們對它進行一些分析吧:首先是一個轉義字符\(,它能出現0次或1次(?),而後是一個0,後面跟着2個數字(\d{2}),而後是)或-或空格中的一個,它出現1次或不出現(?),最後是8個數字(\d{8})。正則表達式

(\d{1,3}\.){3}\d{1,3}是一個簡單的IP地址匹配表達式。要理解這個表達式,請按下列順序分析它:\d{1,3}匹配1到3位的數字,(\d{1,3}\.){3}匹配三位數字加上一個英文句號(這個總體也就是這個分組)重複3次,最後再加上一個一到三位的數字(\d{1,3})。spa

clip_image004

貪婪與懶惰.net

當正則表達式中包含能接受重複的限定符時,一般的行爲是(在使整個表達式能獲得匹配的前提下)匹配儘量多的字符。以這個表達式爲例:a.*b,它將會匹配最長的以a開始,以b結束的字符串。若是用它來搜索aabab的話,它會匹配整個字符串aabab。這被稱爲貪婪匹配。htm

有時,咱們更須要懶惰匹配,也就是匹配儘量少的字符。前面給出的限定符均可以被轉化爲懶惰匹配模式,只要在它後面加上一個問號?。這樣.*?就意味着匹配任意數量的重複,可是在能使整個匹配成功的前提下使用最少的重複。如今看看懶惰版的例子吧:blog

a.*?b匹配最短的,以a開始,以b結束的字符串。若是把它應用於aabab的話,它會匹配aab(第一到第三個字符)ab(第四到第五個字符)ip

clip_image005

正則表達式所有符號解釋正則表達式所有符號解釋

相關文章
相關標籤/搜索