一. RE模塊python
就其本質而言,正則表達式(或 RE)是一種小型的、高度專業化的編程語言,(在Python中)它內嵌在Python中,並經過 re 模塊實現。正則表達式模式被編譯成一系列的字節碼,而後由用 C 編寫的匹配引擎執行。正則表達式
字符匹配(普通字符,元字符):編程
1 普通字符:大多數字符和字母都會和自身匹配
>>> re.findall('alvin','yuanaleSxalexwupeiqi')
['alvin'] 編程語言
2 元字符:. ^ $ * + ? { } [ ] | ( ) \ ---------------------》》》掌握正則表達式的核心spa
正則表達式中的11個元字符:字符串
. 匹配任何一個除換行符之外的符號編譯
^ 匹配字符串的開始位置命名
$ 匹配字符串的末尾位置語言
重複:vi
* 重複【0-無窮】
+ 重複【1-無窮】
? 【0,1】
{m,n} 【m,n】
[ ]字符集:取其中的某一個元素
注意:* + . 等元字符都是普通符號,- ^ \ 有特殊意義, - <範圍> ^ <取反>
( ) 分組
在findall裏面優先把分組裏的內容顯示出來
命名分組的格式 ?P<>
?: 取消優先級
| 或
\ 轉義符
1.後面加一個元字符使其變成普通符號
2.將一些普通符號變成特殊符號 好比:\d<表明任意一個數字> \w < 表明一個字母數字_ >
python解釋器解釋------------>re模塊再解義
r-------->原生字符串,裏面的東西不須要轉義