1、正則表達式在文本處理中的經常使用:正則表達式
1.表達文本類型的特徵(病毒、入侵等)編碼
2.同時查找或替換一組字符串spa
3.匹配字符串的所有或部分(主要) 字符串
2、正則表達式的經常使用操做符table
操做符 | 說明 |
. | 表示任何單個字符 |
[] | 給定單個字符的取值範圍 |
[^] | 限定字符的取值不能是括號裏的字符 |
* | 前一個字符擴展0次或者無限次 |
+ | 前一個字符擴展1次或無限次 |
? | 前一個字符擴展0次或者1次 |
| | 左右表達式中的任意一個 |
{m} | 前一個字符擴展m次 |
{m,n} | 前一個字符擴展m至n次 |
^ | 不在[]裏的^表示匹配字符串的開頭 |
$ | 與^相反,匹配一個字符串的結尾 |
() | 分組標記,在括號內部只能使用|操做符 |
\d | 數字,等價於[0-9] |
\w | 單詞字符,等價於[A-Za-z0-9_] |
3、經典正則表達式實例擴展
^[A-Za-z]+$ | 由26個字母組成的字符串 |
^[A-Za-z0-9]+$ | 由26個字母和數字組成的字符串 |
^-?\d+$ | 整數形式的字符串 |
^[0-9]*[1-9][0-9]*$<=>^[1-9][0-9]*$ | 正整數形式的字符串(^\d+$) |
[1-9]\d{5} | 中國境內郵政編碼,6位(^\d{6}$錯誤),不是字符串 |
[\u4e00-\u9fa5] | 匹配中文字符串 |
\d{3}-\d{8}|\d{4}-\d{7} | 國內電話號碼,010-68913536(^\d{3}-\d{8}$錯誤) |
(([1-9]?\d|1\d{2}|2[0-4]\d|25[0-5]).){3}tab ([1-9]?\d|1\d{2}|2[0-4]\d|25[0-5])文本處理 |
IP地址符(IP地址分4段,每段是0-255) |