應用場景:正則表達式
匹配字符串規則 (字符串:用戶輸入、文件讀取、網絡傳輸)網絡
表單驗證:註冊頁面 、身份證號、手機號碼、郵箱、銀行卡號google
從文件中獲取想要的信息 爬蟲,從網頁中批量的獲取數據(重要啊)。spa
字符組:ci
字符組是指一個字符上容許出現的字符字符串
[0-9] 只容許出現0-9io
[A-Z] 只容許出現A-Ztable
[A-z0-9] 匹配全部大小寫字母及數字表單
[^0-9] 帶' ^ ' 的字符組是指該位置不能出現0-9表單驗證
元字符:
\w | 字母、數字、下劃線 |
\t | Tab鍵 |
\s | 全部空白符(空格、Tab、回車) |
\n | 回車 |
\d | 數字[0-9] |
\b | 字符串兩端 |
\W | 非字母、數字、下劃線 |
\S | 非全部空白符(空格、Tab、回車) |
\D | 非數字 |
. | 除了換行符匹配全部 |
^ | 開始符 |
$ | 結束符 |
[] 字符組,具體內容
() 分組 例:'www\.(baidu|google)\.com' '\'轉義符使 ' . '表明‘.’而不是匹配任意除了換行
| 或 包含關係中,把長的寫在前面
正則匹配量詞
量詞 | 用法 |
{n} | n次 |
{n,} | 至少n次,最多無限 |
{n,m} | 至少n,之多m |
? | 0次或1次 |
+ | 匹配1次或屢次 |
* | 匹配0次或屢次 |
使用:
全部正則表達式的量詞默認貪婪匹配
貪婪匹配:儘量多的給你匹配(規則內)默認模式
非貪婪/惰性匹配 在正則表達式後面加'?'
'.*?'經常使用的非貪婪匹配
findall(?:正則表達式) 取消分則優先顯示