由於以前對於POSIX類的正則表達式使用的比較少,也就沒有上心去記憶,最近由於使用的比較多,就仔細的看了一下作了一個簡單的總結。git
\p{Lower} 小寫字母字符:[a-z]正則表達式
\p{Upper} 大寫字母字符:[A-Z]學習
\p{ASCII} 全部 ASCII:[\x00-\x7F]blog
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]文檔
\p{Digit} 十進制數字:[0-9]it
\p{Alnum} 字母數字字符:[\p{Alpha}\p{Digit}]io
\p{Punct} 標點符號:!"#$%&'()*+,-./:;<=>?@[]^_`{|}~程序
\p{Graph} 可見字符:[\p{Alnum}\p{Punct}]im
\p{Print} 可打印字符:[\p{Graph}\x20]總結
\p{Blank} 空格或製表符:[\x20\t]
\p{Cntrl} 控制字符:[\x00-\x1F\x7F]
\p{XDigit} 十六進制數字:[0-9a-fA-F]
\p{Space} 空白字符:[ \t\n\v\f\r]
由於以前沒有仔細看,都是用的時候在查一下,致使了老是記不住,因此學東西的時候仍是得第一次學習的時候就多花點心思。
如上圖所示,其實很是簡單,就是匹配字符、數字、標點符號、控制字符和空白字符。
Alpha是希臘字符的第一個字符,通常咱們看到這個在程序或者程序文檔中出現基本有統一的語義,就是表示字母,包括大寫字母和小寫字母。
Digit就是字面意義,表示數字,就阿拉伯數字0到9。
Alnum能夠看作是Alpha和number的組合,就是Alpha和Digit的組合,就是大小寫字母和數字[0-9a-zA-Z]。
Punct是Punctuation的縮寫,就是表示標點符號,就是ASCII碼在[33-47]和[58-64]這2個區域,中間是Digit。
Blank,只包含2個字符,空格,ASCII碼32,和製表符\t,ASCII碼9。
Cntrl表示控制字符,ASCII在0到31,在加上ASCII的最後一個127的DEL,製表符也是控制字符。
XDigit是表示十六進制字符,很是簡單。
Space就是ASCII在9-13這5個字符,它們分別是製表符\t,換行符\n,垂直製表符\v,換頁\f,回車\r。