Python正則表達式:最短匹配

最短匹配應用於:假若有一段文本,你只想匹配最短的可能,而不是最長。html

例子

好比有一段html片斷,'<a>this is first label</a><a>the second label</a>',如何匹配出每一個a標籤中的內容,下面來看下最短與最長的區別。正則表達式

代碼

>>> import re
>>> str = '<a>this is first label</a><a>the second label</a>'

>>> print re.findall(r'<a>(.*?)</a>', str)  # 最短匹配
['this is first label', 'the second label']

>>> print re.findall(r'<a>(.*)</a>', str)
['this is first label</a><a>the second label']

解釋

例子中,模式r'<a>(.*?)</a>'的意圖是匹配被<a>和</a>包含的文本,可是正則表達式中*操做符是貪婪的,所以匹配操做會查找出最長的可能。 可是在*操做符後面加上?操做符,這樣使得匹配變成非貪婪模式,從而獲得最短匹配。this

相關文章
相關標籤/搜索