Python 正則表達式——re模塊介紹

Python 正則表達式正則表達式

re 模塊使 Python 語言擁有所有的正則表達式功能,re模塊經常使用方法:express

re.match函數函數

re.match從字符串的起始位置匹配,若是起始位置匹配不成功,則match()就返回none。,若是匹配成功,則可經過group(num) 或 groups()獲取匹配結果。工具

函數語法學習

re.match(pattern,string,flags=0)開發工具

函數參數code

pattern : 正則表達式對象

string : 字符串。blog

flags : 標誌位,用於控制正則表達式的匹配方式,如:是否區分大小寫等等教程

flags模式

re.I 使匹配對大小寫不敏感

re.L 作本地化識別(locale-aware)匹配

re.M 多行匹配,影響 ^ 和 $re.S使 . 匹配包括換行在內的全部字符

re.U 根據Unicode字符集解析字符。這個標誌影響 w, W, , B.

re.X 該標誌經過給予你更靈活的格式以便你將正則表達式寫得更易於理解。

import re

re_str='The re module gives the Python language full regular expression capabilities.'

match_str=re.match('The r(.+?)', re_str)

# group() 匹配的整個表達式的字符串,group() 能夠一次輸入多個組號,在這種狀況下它將返回一個包含那些組所對應值的元組。

print(match_str.group())

輸出 The re

print(match_str.group(1))

輸出 e

# 返回一個包含全部小組字符串的元組,從 1 到 所含的小組號。

print(match_str.groups())

輸出 ('e',)

# 其實位置匹配不成功則返回None

match_str=re.match('module',re_str)

print(match_str)

輸出 None

# 設置爲對大小寫不敏感,re.I

match_str=re.match('the r(.+?)',re_str,re.I)

print(match_str.group())

輸出 The re

re.search方法

re.search 對整個字符串進行匹配並返回第一個成功的匹配字符串,不然返回None。              我剛整理了一套2018最新的0基礎入門和進階教程,無私分享,加Python學習q u n :227-435-450便可獲取,內附:開發工具和安裝包,以及系統學習路線圖

函數語法

re.search(pattern,string,flags=0)

函數參數

pattern : 正則表達式

string : 字符串

flags : 標誌位

search_str=re.search('r(.+?)', re_str)

print(search_str.group())

輸出 re

re.match與re.search的區別

re.match只匹配字符串的開始,若是字符串開始不符合正則表達式,則匹配失敗,而re.search匹配整個字符串,直到找到一個匹配,並返回第一個被匹配到的字符串。

findall

在字符串中匹配全部知足正則表達式的字符串,並返回一個列表,若是沒有找到匹配的,則返回空列表。

函數語法

findall(string[,pos[,endpos]])

函數參數

string : 待匹配的字符串。

pos : 可選參數,指定字符串的起始位置,默認爲 0。

endpos : 可選參數,指定字符串的結束位置,默認爲字符串的長度。

findall_str=re.findall('i.+?',re_str)

print(findall_str)

# 上面仍是使用re.findall的方式,這裏推薦使用re.compile生成正則表達式對象,而後按照上面參數說明使用該函數,以下。

pattern=re.compile('i.+?')

pattern.findall(re_str)

輸出 ['iv', 'io', 'il', 'it', 'ie']

re.split

split 方法按照可以匹配的子串將字符串分割後返回列表

函數語法

re.split(pattern,string[,maxsplit=0,flags=0])

函數參數

pattern : 正則表達式

string : 字符串

maxsplit : 分隔次數,maxsplit=1 分隔一次,默認爲 0,不限制次數。

flags : 標誌位

split_str=re.split('i.+?',re_str)

print(split_str)

輸出 ['The re module g', 'es the Python language full regular express', 'n capab', '', '', 's.']

附 嘔心瀝血整理的正則表達式的語法規則

正則表達式的語法規則

正則表達式的語法規則

相關文章
相關標籤/搜索