正則表達式,看完這篇仍是不夠的。

看了好幾回正則表達式,稍微碰到複雜的仍是看不懂。html

不少文章宣稱,看完這編就夠了。夠了,真是夠了,有多少人看完仍是不會複雜表達式?大部分文章都沒有去分析複雜例子,沒有寫任何體會。把教材基本語法說一說,就敢宣稱,你懂了。java

仍是推薦https://github.com/ziishaned/learn-regex/blob/master/translations/README-cn.md#41--%E6%AD%A3%E5%85%88%E8%A1%8C%E6%96%AD%E8%A8%80git

配合在線練習來學習。github

 

此次認真根據每一個語法符號作了幾個例子,比較清晰了。記錄幾點要點。正則表達式

最基本要記住,正則表達式能夠稱爲,貪婪獲得子字符串的表達式。windows

1.正則表達式的基本目的就是查找目標字符串中符合表達式的 ‘子字符串’。app

   1.1明確這個很重要。由於不一樣的語言會給表達式類附加不少功能和函數。match,find.等等。這些功能都是從這個基本目的引伸出來的。千萬別忘記了這些功能都是基於正則表達式的基本目的。ide

   1.2並且明確了這個目的也會幫助理解正則語法中的^和$符號。 記住^和$也是來找 ‘子字符串‘的,只不過^$同時出現,恰巧表達了總體匹配表達式的含義,表達出了 ‘子字符串’是總體字符串的特例的狀況。函數

        理解^$同時出現的解釋: 某個子串,必須開頭匹配表達式,並且結尾也必須匹配表達式,那麼若是存在匹配的子串,它也只能是整個字符串。學習

 

2.表達式的每一個符號的語法仍是要清晰的掌握。隨便看一眼,是懂非懂,無濟於事。

   2.1  [ ] ,表達的是  單個字符。因此才能夠[^xxx],來表示 非某集合的單個符號。而 (||),表達的選擇其中的字符串。(^||)是沒法表達非字符的意思的。由於這個語法沒法肯定非以後,你須要字符的長度。它不會表達非的語法。而是表達開頭匹配的意思。

               要表達非子串,必須依賴 預查功能, 仔細想一想,(^||),沒法表達長度,並且語法也沒有支持它表達任意長度。因此必須依賴 否預查,

               一段語法表示你要查的東西,附加一個預查功能,還有一個重點依然是第一要點。會有不少子串知足 非子串的功能。 

 

3.表達式默認的是貪婪模式,因此不少時候,咱們並無輸入^$,  但結果是整個字符串,而不是子串。當咱們明確整個全匹配,最好加上^$,而不要依賴貪婪模式,這有助於咱們理解正則表達式的本意。

  還有貪婪模式的方向是貪婪的包含,而不是貪婪的非包含,因此再表達 非的時候,每每表達式和咱們想要表達的意思不一樣。

 

以幾個例子來分析正則表達式。

經常使用語法

1.  . 表明一個任意字符。   * 號不是通配符, 在正則中,它是表示無限重複前面的表達式。它自己單獨是沒有做用的。

2. [ ] 表示的是選擇出一個單個字符。 ( ) 這個符號有不少組合,是最容易混淆的。 (|  |) 表示選擇  . ()表示子表達式,用於分組,或者 讓某些符號起做用如()*,讓子表達式能夠重複。   (?=) 又能夠表示斷言。

3.    ^(?!.*apple).*$     是否含有apple,含有返回位置0,不含有不返回數字。 返回的數字,表示從那個位置開始進行下一個匹配。而咱們通常的 表達式返回的是2個數字。表示這段區間是匹配的。從這段區間開始下一次表達式的匹配。

4.  斷言語法又是個有 個性 的表達式。 後斷言,寫在某子表達式的後面。前斷言又須要寫在表達式的前面。太戲精了。都有不一樣的符號表達先後之分。爲何不都放在表達式的後面呢?

 

一。表示一個不包含apple 的字符串,該如何寫。


如字符串爲 this is an apple! 咱們如何寫一個表達式,讓他不匹配 'this is an apple!'
1.(^apple)
這裏^沒有表示非的意思。^只能和[]單個字符來組合。這裏的()表示了一個組,而不是選擇符號。^表示的是 要 開頭匹配表達式,也就是^符號的另一個語法含義。
我是如何知道的? 點這裏。https://regex101.com/r/IDDARt/76 輸入 (^apple) 這個表達式。它就會告訴你。這個網址是你掌握表達式的利器。
2.[^a][^p][^p][^l][^e]
這樣呢?那我 一個一個組合啊。聰明嗎?毛線。仔細想一想[]表示的是一個字符。那麼這裏表示的是 我要匹配5個字符,任意5個字符。只要1位置不是a,2位置不是p,3位置不是p,4l.5.e。 若是隻有1或2個或6個以上字符。是不會匹配的。
3.再認真想一想,咱們的需求:表示一個不包含apple 的字符串。‘不包含apple’ 這個是一個修飾,而不是要找的東西。是否是很眼熟,這個不就是預查的語法意義嗎,?= ?! ?<= ?<!
3.1首先必須加上^$,由於不加的話 是子串不包含apple,這個就太多匹配的了。不是咱們的本意,咱們要的是整個字符串不包含apple,而不是其中某子串不包含也能夠。
3.2 那這樣行不行? ^.*(?!apple).*$ 。初看是能夠,其實也不行。由於正則表達式是貪婪匹配,能夠匹配不少。this is an apple!中, 第一個 .* 能夠匹配 this is an app .那那麼後面只有le.也是符合表達式的。
3.3 想不出來,由於我是隱約記得有這個表達式,可是本身沒去認真看,想本身推寫出來。到這裏卡殼了。
3.4... 往前預查,能夠用.*來貪婪做弊。可是咱們能夠用日後預查吧。 已經獲得的字符串,無法做弊吧。 ^.*(?<!apple)$ ,不行 ^.*(?<!apple).*$ 也不行。 仔細思考。由於他不是準確表示了不包含的意思。
^.*(?<!apple)$ 這個能夠準確表示結尾不能是apple,但不是包含, ^.*(?<!apple).*$ 這個就離譜了,解釋器能夠能夠經過末尾的 .* ,對字符牀進行任何的切割來使他不包含apple。如這裏.*能夠表示ple!。又是做弊。
3.5 惟一想到的是 ^.*(?<!apple.*)$ 。可是它不是個合法的表達式。 看別人的寫法吧。不想了。 ^((?!hede).)*$
3.6 ^((?!hede).)*$ ,某個字符的前面不包含hede,以後再對此類字符擴展。 恩。沒想到還能這樣寫。 由於.*以後再描述它的限制,會讓解釋器利用.*來暴力匹配合適的狀況。 而 (?!hede). .讓解釋器只有一種解釋。恩。不錯。。。

3.7 本身作密碼驗證又發現一個更簡單的寫法。 用空表達式的後查    ^(?!.*apple).*$  。能夠匹配是否包含apple。並從0位置。開始繼續下面的匹配。

 二,常見密碼驗證,必須包含大寫字母,小寫字母。長度9到16,並且只能是字母和數字。

^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z])[0-9a-zA-Z]{9,16}$

1.本身真是不容易才推出來。涉及到的語法細節,不少文章都沒有介紹。首先咱們的要求是必須包含。 含有此意思的語法符號又是斷言語法(?xxx).可是想一想,斷言語法,是不包含斷言語句的。也就是匹配以後是不包含數字,字母的。這個。。。

2.因此這裏有個大部分文章沒有講的一個細節。若是  (?=) 以前,沒有表達式的話,那麼返回的不是匹配的子串,而是一個位置,position.   (?=.*[0-9]),這個的意思是返回出現數字以前的位置,並且能夠有任意符號。那麼對於abc123456789A

會返回除下A以前的位置的全部位置。若是咱們加上^,那麼把匹配縮到0位置。   全部 ^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z])  這個會匹配含有小寫,大寫,數字的字符串的0位置。 

我是如何沒有了解相關介紹,而本身推出來的?

仍是咱們的利器。https://regex101.com/r/IDDARt/13  。本身寫例子。本身看右邊的解釋,一點一點測試推測,求證。

3.加上^返回了咱們匹配的其實位置。那麼這個時候纔開始寫匹配表達式。 由於已經包含了大寫,小寫字母,數字。 因此咱們的 要求就變成了 長度了。因此後面寫[0-9a-zA-Z]{9,16}$。結束。

4.再總結下,前面沒有表達式直接寫(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z])    會返回一個位置,告訴你符合這些 預判條件的初始位置在那裏。 由於咱們是要求初始位置必須是0.因此加上^,看看是否匹配,或者說去掉非0位置的其餘匹配。

  獲得初始位置,就是咱們下面語句匹配的開始位置。咱們設定了爲0,也就是字符開頭。 咱們只要長度和類型就能夠。因此[0-9a-zA-Z]{9,16},而且必須包含結尾。$

5. 受這裏啓發。我發現表示不包含有個更簡潔的表示方法。   ^(?!.*apple).*$

 

3.省份證。

(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)

很簡單了。不解釋。 

 

 其實仔細看下正則表達式語法真的不多了。

正則表達式的所有語法字符。

 

 

元字符

元字符 描述
. 句號匹配任意單個字符除了換行符.
[ ] 字符種類. 匹配方括號內的任意字符.
[^ ] 否認的字符種類. 匹配除了方括號裏的任意字符
* 匹配>=0個重複的在*號以前的字符.
+ 匹配>=1個重複的+號前的字符.
? 標記?以前的字符爲可選.
{n,m} 匹配num個大括號以前的字符 (n <= num <= m).
(xyz) 字符集, 匹配與 xyz 徹底相等的字符串.
| 或運算符,匹配符號前或後的字符.
\ 轉義字符,用於匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ \ |
^ 從開始行開始匹配.
$ 從末端開始匹配.

 

 

               

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 簡寫字符集

 

正則表達式提供一些經常使用的字符集簡寫. 以下:

簡寫 描述
. 除換行符外的全部字符
\w 匹配全部字母數字, 等同於 [a-zA-Z0-9_]
\W 匹配全部非字母數字, 即符號, 等同於: [^\w]
\d 匹配數字: [0-9]
\D 匹配非數字: [^\d]
\s 匹配全部空格字符, 等同於: [\t\n\f\r\p{Z}]
\S 匹配全部非空格字符: [^\s]
\f 匹配一個換頁符
\n 匹配一個換行符
\r 匹配一個回車符
\t 匹配一個製表符
\v 匹配一個垂直製表符
\p 匹配 CR/LF (等同於 \r\n),用來匹配 DOS 行終止符

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

零寬度斷言,

說人話:匹配表達式的附加條件,

我要找小紅旁邊的(斷言)男孩子。因此我要找的是男孩子,小紅的不要(零寬度)。

 

 

符號 描述
?= 正先行斷言-存在
?! 負先行斷言-排除
?<= 正後發斷言-存在
?<! 負後發斷言-排除

 

  後面應該有

 後面不該該有

前面應該有

前面不該該有

 

其餘語法規則

() ,表示分組,可用於後面來引用它,後向引用用於重複搜索前面某個分組匹配的文本。例如,\1表明分組1匹配的文本

\b(\w+)\b\s+\1\b能夠用來匹配重複的單詞,像go go, 或者kitty kitty。

下面列出了最經常使用的一些:

 

表4.經常使用分組語法
分類 代碼/語法 說明
捕獲 (exp) 匹配exp,並捕獲文本到自動命名的組裏
(?<name>exp) 匹配exp,並捕獲文本到名稱爲name的組裏,也能夠寫成(?'name'exp)
(?:exp) 匹配exp,不捕獲匹配的文本,也不給此分組分配組號
零寬斷言 (?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp後面的位置
(?!exp) 匹配後面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置
註釋 (?#comment) 這種類型的分組不對正則表達式的處理產生任何影響,用於提供註釋讓人閱讀

 

 

 

 

 

 

 

 

 

 

最後還有平衡組/遞歸匹配

 

學習中途的理解

//思考一個表達式語法如何能夠表示任何東西?首先必須有語法表示:
//某子段表達式出現0到無數次。只有掌握重複本身的技能,纔有從有限到無限的可能。
//因此須要有1,表示子段的能力。2表示重複次數的能力。
//其次必須有1.表示某個符號的能力,2.表示任意符號的能力,3.表示某組符號中的一個的能力。那麼這樣的話,和前面的能力結合,理論上就能夠表示任何東西。
//固然擴展開來,有一個非符號,在某些狀況下,能夠表達更簡潔,特別注意非,首先是某個能夠表示肯定含義的語法(肯定的長度和符號範圍)才能去非。[]是肯定的語法,肯定了1長度。任意字符爲範圍。
//而對於匹配後的繼續子匹配,能夠在一次匹配中就表達出。須要擴展語法。java 用().
//其實 regex 晦澀就在於細節多,碎片學習的話,可能就會對於()的分組做用漏學。致使誤認爲是選擇含義,產生各類疑惑。由於各類組合表示能夠有多種語法表示,有的簡潔,有的複雜。因此加大了看懂別人表達式的難度。
//[]是單個字符含義,()是選擇和分組。{} 是表示重複概念。

 

 

 

 

1 . 校驗密碼強度

密碼的強度必須是包含大小寫字母和數字的組合,不能使用特殊字符,長度在8-10之間。

^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

2. 校驗中文

字符串僅能是中文。

^[\\u4e00-\\u9fa5]{0,}$

3. 由數字、26個英文字母或下劃線組成的字符串

^\\w+$

4. 校驗E-Mail 地址

同密碼同樣,下面是E-mail地址合規性的正則檢查語句。

[\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w-]*[\\w])?

5. 校驗身份證號碼

下面是身份證號碼的正則校驗。15 或 18位。

15位:
^[1-9]\\d{7}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}$
18位:
^[1-9]\\d{5}[1-9]\\d{3}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}([0-9]|X)$

6. 校驗日期

「yyyy-mm-dd「 格式的日期校驗,已考慮平閏年。

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

7. 校驗金額

金額校驗,精確到2位小數。

^[0-9]+(.[0-9]{2})?$

8. 校驗手機號

下面是國內 1三、1五、18開頭的手機號正則表達式。(可根據目前國內收集號擴展前兩位開頭號碼)

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$

9. 判斷IE的版本

IE目前還沒被徹底取代,不少頁面仍是須要作版本兼容,下面是IE版本檢查的表達式。

^.*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$

10. 校驗IP-v4地址

IP4 正則語句。

\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b

11. 校驗IP-v6地址

IP6 正則語句。

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

12. 檢查URL的前綴

應用開發中不少時候須要區分請求是HTTPS仍是HTTP,經過下面的表達式能夠取出一個url的前綴而後再邏輯判斷。

if (!s.match(/^[a-zA-Z]+:\\/\\//))
{
    s = 'http://' + s;
}

13. 提取URL連接

下面的這個表達式能夠篩選出一段文本中的URL。

^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?

14. 文件路徑及擴展名校驗

驗證windows下文件路徑和擴展名(下面的例子中爲.txt文件)

^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$

15. 提取Color Hex Codes

有時須要抽取網頁中的顏色代碼,可使用下面的表達式。

^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$

16. 提取網頁圖片

倘若你想提取網頁中全部圖片信息,能夠利用下面的表達式。

\\< *[img][^\\\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)

17. 提取頁面超連接

提取html中的超連接。

(<a\\s*(?!.*\\brel=)[^>]*)(href="https?:\\/\\/)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list).'))[^"]+)"((?!.*\\brel=)[^>]*)(?:[^>]*)>

18. 查找CSS屬性

經過下面的表達式,能夠搜索到相匹配的CSS屬性。

^\\s*[a-zA-Z\\-]+\\s*[:]{1}\\s[a-zA-Z0-9\\s.#]+[;]{1}

19. 抽取註釋

若是你須要移除HMTL中的註釋,可使用以下的表達式。

<!--(.*?)-->

20. 匹配HTML標籤

經過下面的表達式能夠匹配出HTML中的標籤屬性。





<\\/?\\w+((\\s+\\w+(\\s*=\\s*(?:".*?"|'.*?'|[\\^'">\\s]+))?)+\\s*|\\s*)\\/?>
經常使用正則表達式

1、校驗數字的表達式

  • 數字:^[0-9]*$
  • n位的數字:^\d{n}$
  • 至少n位的數字:^\d{n,}$
  • m-n位的數字:^\d{m,n}$
  • 零和非零開頭的數字:^(0|[1-9][0-9]*)$
  • 非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(\.[0-9]{1,2})?$
  • 帶1-2位小數的正數或負數:^(\-)?\d+(\.\d{1,2})$
  • 正數、負數、和小數:^(\-|\+)?\d+(\.\d+)?$
  • 有兩位小數的正實數:^[0-9]+(\.[0-9]{2})?$
  • 有1~3位小數的正實數:^[0-9]+(\.[0-9]{1,3})?$
  • 非零的正整數:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
  • 非零的負整數:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
  • 非負整數:^\d+$ 或 ^[1-9]\d*|0$
  • 非正整數:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
  • 非負浮點數:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
  • 非正浮點數:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
  • 正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
  • 負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
  • 浮點數:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

校驗字符的表達式

  • 漢字:^[\u4e00-\u9fa5]{0,}$
  • 英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
  • 長度爲3-20的全部字符:^.{3,20}$
  • 由26個英文字母組成的字符串:^[A-Za-z]+$
  • 由26個大寫英文字母組成的字符串:^[A-Z]+$
  • 由26個小寫英文字母組成的字符串:^[a-z]+$
  • 由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
  • 由數字、26個英文字母或者下劃線組成的字符串:^\w+$ 或 ^\w{3,20}$
  • 中文、英文、數字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$
  • 中文、英文、數字但不包括下劃線等符號:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
  • 能夠輸入含有^%&',;=?$\"等字符:[^%&',;=?$\x22]+
  • 禁止輸入含有~的字符:[^~\x22]+

3、特殊需求表達式

  • Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
  • 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
  • InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
  • 手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
  • 電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
  • 國內電話號碼(0511-440522二、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
  • 電話號碼正則表達式(支持手機號碼,3-4位區號,7-8位直播號碼,1-4位分機號): ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
  • 身份證號(15位、18位數字),最後一位是校驗位,可能爲數字或字符X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
  • 賬號是否合法(字母開頭,容許5-16字節,容許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
  • 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-zA-Z]\w{5,17}$
  • 強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在 8-10 之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
  • 強密碼(必須包含大小寫字母和數字的組合,可使用特殊字符,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
  • 日期格式:^\d{4}-\d{1,2}-\d{1,2}
  • 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
  • 一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
  • 錢的輸入格式:
    1. 有四種錢的表示形式咱們能夠接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$
    2. 這表示任意一個不以0開頭的數字,可是,這也意味着一個字符"0"不經過,因此咱們採用下面的形式:^(0|[1-9][0-9]*)$
    3. 一個0或者一個不以0開頭的數字.咱們還能夠容許開頭有一個負號:^(0|-?[1-9][0-9]*)$
    4. 這表示一個0或者一個可能爲負的開頭不爲0的數字.讓用戶以0開頭好了.把負號的也去掉,由於錢總不能是負的吧。下面咱們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$
    5. 必須說明的是,小數點後面至少應該有1位數,因此"10."是不經過的,可是 "10" 和 "10.2" 是經過的:^[0-9]+(.[0-9]{2})?$
    6. 這樣咱們規定小數點後面必須有兩位,若是你認爲太苛刻了,能夠這樣:^[0-9]+(.[0-9]{1,2})?$
    7. 這樣就容許用戶只寫一位小數.下面咱們該考慮數字中的逗號了,咱們能夠這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
    8. 1到3個數字,後面跟着任意個 逗號+3個數字,逗號成爲可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
    9. 備註:這就是最終結果了,別忘了"+"能夠用"*"替代若是你以爲空字符串也能夠接受的話(奇怪,爲何?)最後,別忘了在用函數時去掉去掉那個反斜槓,通常的錯誤都在這裏
  • xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
  • 中文字符的正則表達式:[\u4e00-\u9fa5]
  • 雙字節字符:[^\x00-\xff] (包括漢字在內,能夠用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1))
  • 空白行的正則表達式:\n\s*\r (能夠用來刪除空白行)
  • HTML標記的正則表達式:<(\S*?)[^>]*>.*?|<.*? /> ( 首尾空白字符的正則表達式:^\s*|\s*$或(^\s*)|(\s*$) (能夠用來刪除行首行尾的空白字符(包括空格、製表符、換頁符等等),很是有用的表達式)
  • 騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)
  • 中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼爲6位數字)
  • IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))
相關文章
相關標籤/搜索