1、正則表達式正則表達式
1.正則表達式的概念框架
2.正則表達式的應用ide
3.正則表達式的使用函數
正則表達式的語法由字符和操做符構成工具
正則表達式的經常使用操做符:編碼
#P(Y|YT|YTH|YTHO)?N ===》 'PN'、'PYN'、'PYTN'、'PYTHN'、'PYTHON' #PYTHON+ ===》 'PYTHON'、'PYTHONN'、'PYTHONNN'… #PY[TH]ON ===》 'PYTON'、'PYHON' #PY[^TH]?ON ===》 'PYON'、'PYaON'、'PYbON'、'PYcON'… #PY{:3}N ===》 'PN'、'PYN'、'PYYN'、'PYYYN'…
# ^[A-Za-z]+$ 由26個字母組成的字符串 # ^[A-Za-z0-9]+$ 由26個字母和數字組成的字符串 # ^-?\d+$ 整數形式的字符串 # [0-9]*[1-9][0-9]*$ 正整數形式的字符串 # [1-9]\d{5} 中國境內郵政編碼,6位 # [\u4e00-\u9fa5] 匹配中文字符 # \d{3}-\d{8}|\d{4}-\d{7} 國內電話號碼 #匹配IP地址的正則表達式: #把255分紅四段標識 #(([1-9]?\d|1\d{2}|2[0-4]\d|25[0-5]).){3}([1-9]?\d|1\d{2}|2[0-4]\d|25[0-5])
2、re庫的使用spa
1.正則表達式的表示類型code
2.re庫的主要功能函數對象
re.match(pattern,string,flags=0),在一個字符串的開始位置起匹配正則表達式,返回match對象。blog
re.search(pattern,string,flags=0),在一個字符串中搜索匹配正則表達式的第一個位置,返回match對象
re.findall(pattern,string,flags=0),搜索字符串,以列表類型返回所有能匹配的字串
re.split(pattern,string,maxsplit=0,flags=0),將一個字符串按照正則表達式匹配結果進行分割返回列表類型
re.finditer(pattern,string,flags=0),搜索字符串,返回一個匹配結果的迭代類型,每一個迭代類型是match對象
re.sub(pattern,repl,string,count=0,flags=0),在一個字符串中替換全部匹配正則表達式的字串,返回替換後的字符串
總結:
3.re庫的另外一種等價用法
regex=re.compile(pattern,flags=0),將正則表達式的字符串形式編譯成正則表達式對象。
4.match對象介紹
match對象的屬性:
match對象的方法:
5.re庫的貪婪匹配和最小匹配
re庫默認採用貪婪匹配,即輸出匹配最長的字串
import re string="PYONOOOOOOON" match=re.search(r'PY.*N',string) print(match.group(0)) #PYONOOOOOOON
最小匹配:
import re string="PYONOOOOOOON" match=re.search(r'PY.*?N',string) print(match.group(0)) #PYON
最小匹配操做符: