正則表達式

應用場景:正則表達式

              匹配字符串規則    (字符串:用戶輸入、文件讀取、網絡傳輸)網絡

              表單驗證:註冊頁面 、身份證號、手機號碼、郵箱、銀行卡號google

              從文件中獲取想要的信息     爬蟲,從網頁中批量的獲取數據(重要啊)。spa

字符組:ci

字符組是指一個字符上容許出現的字符字符串

[0-9]       只容許出現0-9io

[A-Z]      只容許出現A-Ztable

[A-z0-9]  匹配全部大小寫字母及數字表單

[^0-9]       帶' ^ ' 的字符組是指該位置不能出現0-9表單驗證

元字符:

元字符匹配
 \w 字母、數字、下劃線
\t Tab鍵
\s 全部空白符(空格、Tab、回車)
\n 回車
\d 數字[0-9]
\b 字符串兩端
\W 非字母、數字、下劃線
\S 非全部空白符(空格、Tab、回車)
\D 非數字
. 除了換行符匹配全部
^ 開始符
$ 結束符

[]  字符組,具體內容

() 分組  例:'www\.(baidu|google)\.com'     '\'轉義符使  ' . '表明‘.’而不是匹配任意除了換行

|   或     包含關係中,把長的寫在前面
正則匹配量詞

正則匹配中量詞用法
量詞 用法
{n} n次
{n,} 至少n次,最多無限
{n,m} 至少n,之多m
0次或1次
+ 匹配1次或屢次
* 匹配0次或屢次

使用:

全部正則表達式的量詞默認貪婪匹配

貪婪匹配:儘量多的給你匹配(規則內)默認模式

非貪婪/惰性匹配  在正則表達式後面加'?'

'.*?'經常使用的非貪婪匹配

findall(?:正則表達式) 取消分則優先顯示 

相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息