一前言
本篇文章帶你們快速入門正則表達式的使用,正則表達式的規則不只適用python語言,基本大多數編程語言都適用,在平常使用中極爲普遍,讀者們有必要學好正則表達式。看完這篇文章,讀者們要理解什麼是正則表達式,正則表達式的規則,常見的正則表達式示例,如何在python中使用函數進行正則表達式操做;python
二 正則表達式的概念
正則表達式是指在一串字符串中使用特殊的模式匹配得到子串,咱們能夠對得到的子串進行提取,替換等操做;正則表達式
舉個例子zszxz666 這個字符串,如今知識追尋者想要得到子串zszxz, 則須要通過一個模式匹配後得到子串,在正則表達式中這個模式能夠不少種格式,知識追尋者在這邊使用最簡單的模式 [a-z]*,而後通過python正則表達式匹配函數就能夠得到子串zszxz;這種方式比平時的字符串函數操做更加簡便,適用範圍普遍;
ps:另外不少人在學習Python的過程當中,每每由於沒有好的教程或者沒人指導從而致使本身容易放棄,爲此我建了個Python交流.裙 :一久武其而而流一思(數字的諧音)轉換下能夠找到了,裏面有最新Python教程項目可拿,不懂的問題多跟裏面的人交流,都會解決哦!編程
三 經常使用的正則匹配模式
經常使用的正則表達式模式以下,若是對這些模式有疑惑的能夠參照 正則表達式手冊 ;手冊中還有平常使用的正則示例,好比用戶名,密碼,郵箱,URL 的匹配模式等;網絡
模式 含義
^ 匹配字符串的開頭
$ 匹配字符串的末尾
. 匹配任意字符,除了換行符
+ 匹配前面的子表達式一次或屢次
? 匹配前面的子表達式零次或一次,或表示一個非貪婪限定符
* 匹配前面的子表達式零次或屢次
\ 轉義特殊字符
\d 匹配任意數字,等價於 [0-9]。
\D 匹配任意非數字
\s 匹配任意空白字符(製表,換行,回車,換頁,垂直製表),等價於[^\f\n\r\t\v]
\S 匹配任何非空白字符。等價[^\f\n\r\t\v]
\w 匹配數字字母下劃線
\W 匹配非數字字母下劃線
[…] 用來表示一組字符;[amk] 匹配 ‘a’,‘m’或’k’
[^…] 不匹配在[]中的字符;[^amk]不匹配 ‘a’,‘m’或’k’
{n} 匹配前面的子表達式n 次
{n,} 匹配前面的子表達式至少n 次
{n,m} 匹配前面的子表達式最少匹配 n 次且最多匹配 m 次
| 表示或;a| b,表示匹配a或者b
\b 匹配一個單詞邊界,即字與空格間的位置
\B 非單詞邊界匹配
四 python正則經常使用修斯符
re.I 使匹配對大小寫不敏感
re.L 作本地化識別(locale-aware)匹配
re.M 多行匹配,影響 ^ 和 $
re.S 使 . 匹配包括換行在內的全部字符
re.U 根據Unicode字符集解析字符。這個標誌影響 \w, \W, \b, \B.
re.X 該標誌經過給予你更靈活的格式以便你將正則表達式寫得更易於理解
五 python經常使用正則行數說明
pattern 表示正則表達式模式
string 表示傳入待匹配字符串
flags 標誌位,能夠用第四節的修飾符限定
count 表示限定匹配的次數
repl 表示替換的字符串,也可爲一個函數
pos 起始位置
endpos 結束位置
maxsplit 最大分割次數
函數名稱 函數含義
re.findall(string, pos, endpos) 匹配全部子串,並返回一個列表,未匹配,則返回空列表
re.match(pattern, string, flags=0) 從字符串的起始位置匹配一個模式,若是匹配失敗返回None
re.search(pattern, string, flags=0) 掃描整個字符串並返回第一個成功的匹配;匹配失敗返回None
re.compile(pattern, flags=0) 編譯正則表達式,生成一個正則表達式( Pattern )對象
re.sub(pattern, repl, string, count=0, flags=0) 查找和替換
re.finditer(pattern, string, flags=0) 與findall相似,返回的是迭代器
re.split(pattern, string, maxsplit=0, flags=0]) 將匹配的子串分割後返回列表
六 經常使用函數示例
6.1 match函數
group(num=0) 函數表示提取匹配的表達式,可使用組號提取對應的匹配結果;知識追尋者想要得到字符串中第一個出現的數字串;編程語言
import re
# 指定模式 至少匹配一個數字
pattern = re.compile(r'\d+')
# 輸入的字符串
mat = pattern.match("451zszxz666")
# 得到第一個匹配到的值
g = mat.group();
# 451
print(g)
6.2search函數
知識追尋者想要得到指定的字符串,第一個匹配的就好;函數
import re
# 想匹配nhzszxz 或者 nh666 或者 nhnh
pattern = re.compile(r'nh(zszxz|666|nh)')
ser = pattern.search('nhzszxzkkk nh666 llll nhnh')
g_0 = ser.group()
# zszxz
print(g_0)
g_1 = ser.group(1)
# nhzszxz
print(g_1)
6.3 findall函數
知識追尋者想要在字符串中得到全部的數字;工具
import re
pattern = re.compile(r'\d+')
# 輸入的字符串
mat = pattern.fidall("451zszxz666")
# ['451', '666']
print(mat)
# 666
print(mat[1])
6.6 sub函數
知識追尋者想要得到全部非數字的子串;學習
import re
str = '8556gfggs5555dfg'
# 替換全部數字
result = re.sub(r'\d', '', str)
# gfggsdfg
print(result)
6.7 split函數
知識追尋者想要得到以,分割的字符串;測試
import re
str = '123,456,zszxz,666'
result = re.split(',',str)
# ['123', '456', 'zszxz', '666']
print(result)
6.8 finditer 函數
知識追尋者想要得到數字451,和666;code
import re
pattern = re.compile(r'\d+')
# 輸入的字符串
mat = pattern.finditer("451zszxz666")
for it in mat:
print(it.group())
七 初學者使用正則表達式正確的姿式
初學者在使用正則表達式的時候不免會獲得的匹配的結果與本身預期的不符合,能夠藉助一些在線工具匹配完成後再進行代碼編寫,經常使用的在線正則匹配測試以下;
在線工具
站長工具
-----以上就是本次分享:另外不少人在學習Python的過程當中,每每由於沒有好的教程或者沒人指導從而致使本身容易放棄,爲此我建了個Python交流.裙 :一久武其而而流一思(數字的諧音)轉換下能夠找到了,裏面有最新Python教程項目可拿,不懂的問題多跟裏面的人交流,都會解決哦!本文的文字及圖片來源於網絡加上本身的想法,僅供學習、交流使用,不具備任何商業用途,版權歸原做者全部,若有問題請及時聯繫咱們以做處理。