python正則表達式(7)--flag修飾符、match對象屬性

時間 2019-11-11

標籤 python 正則表達式 flag 修飾 match 對象屬性欄目 Python 简体版

原文原文鏈接

正則表達式—修飾符

正則表達式能夠包含一些標誌修飾符來控制匹配模式，用在正則表達式處理函數中的flag參數中，爲可選參數。正則表達式

(1)　re.I 全寫(re.IGNORECASE)

表示使匹配時，忽略大小函數

(2)　re.M 全寫(re.MULTILINE)

多行匹配，影響 ^ 和 $的行爲spa

(3)　re.S 全寫(re.DOTALL)

使點（.）匹配包括換行在內的全部字符對象

(4)　re.X 全寫(re.VERBOSE)

這個模式下正則表達式能夠是多行，忽略空白字符，並能夠加入註釋。索引

(5)　除以上標誌外還有re.L和re.U，但不經常使用

(6)　能夠經過使用運算符「|「來指定多個標誌，表示同時生效。

如： re.I | re.M被設置成I和M標誌，字符串

content = 'My username is zeke999!'string

re.search(r'zeke\d{3}', content, re.I | re.M)ast

Match對象的屬性

(1)string 屬性:

獲取匹配時使用的字符串對象object

>>> m = re.match(r'\d+','456abc')搜索

>>> m.string

'456abc'

(2)re 屬性:

匹配時使用的pattern對象，也就是匹配到內容的正則表達式對象

>>> m

<_sre.SRE_Match object at 0x02C8FA68>

>>> m.re

<_sre.SRE_Pattern object at 0x02D4ECD0>

(3)pos屬性：

該屬性表示文本中正則表達式開始搜索的索引。值與Pattern.match()和Pattern.seach()方法中的同名參數相同

>>> m.pos

(4)endpos屬性：

該屬性表示文本中正則表達式結束搜索的索引。值與Pattern.match()和 Pattern.seach()方法中的同名參數相同

>>> m.endpos

(5)lastindex屬性：

該屬性表示最後一個被捕獲的分組在文本中的索引。若是沒有被捕獲的分組，將爲None

>>> m = re.match(r'a(b)(c)d','abcdef')

>>> m.lastindex

(6)lastgroup屬性:

該屬性表示最後一個被捕獲的分組別名。若是這個分組沒有別名或者沒有被捕獲的分組，將爲None。

(7)group([group1, ...])：

得到一個或多個分組截獲的字符串；指定多個參數時將以元組形式返回。group1能夠使用編號也能夠使用別名；編號0表明匹配的整個子串；默認返回group(0)

實例：group函數傳多個參數

p = re.compile('(a(b)c)d')

m = p.match('abcd')

resTup = m.group(1,2,1)

print resTup

>>>('abc', 'b', 'abc')

(8)groups([default=None])

以元組形式返回所有分組截獲的字符串。至關於調用group(1,2,…last)

(9)start([group=0])

返回指定的組截獲的子串在string中的起始索引（子串第一個字符的索引）。默認爲第0組,即整個字符串

(10)end([group=0])

返回指定的組截獲的子串在string中的結束索引（子串最後一個字符的索引）。group默認值爲0,即整個字符串

(11)span([group])

該方法表示以元組的形式返回 (start(group), end(group))，即某個分組的匹配文字內容在被匹配字符串的開始索引位置和結束索引位置

(12)expand(template)

將匹配到的分組代入template中而後返回。template中能夠使用\id或\g<id>、\g<name> 引用分組，但不能使用編號0。\id與\g<id>是等價的；但\10將被認爲是第10個分組，若是你想表達\1以後是字符'0'，只能使用\g<1>0。

m = re.search(r'(\w+)! (\w+) (\w+)','HMan! How finny！') #將匹配的結果帶入 print m.expand(r'resut:\3 \2 \1')

>>> resut:finny How HMan

(13)groupdict([default=None])

該函數的做用是，將全部匹配到而且指定了別名的分組，以別名爲key，匹配到的字串爲value，存於字典中，而後返回這個字典。若是表達式中未設置別名分組，就會返回一個空字典

>>> m = re.search(r'(?P<num>\d+)(\w+)','78fd')

>>> m.groupdict()

{'num': '78'}

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。