正則表達式,看完這篇仍是不夠的。

時間 2019-11-12

標籤正則表達式看完仍是不夠欄目正則表達式简体版

原文原文鏈接

看了好幾回正則表達式，稍微碰到複雜的仍是看不懂。html

不少文章宣稱，看完這編就夠了。夠了，真是夠了，有多少人看完仍是不會複雜表達式？大部分文章都沒有去分析複雜例子，沒有寫任何體會。把教材基本語法說一說，就敢宣稱，你懂了。java

配合在線練習來學習。github

此次認真根據每一個語法符號作了幾個例子，比較清晰了。記錄幾點要點。正則表達式

最基本要記住，正則表達式能夠稱爲，貪婪獲得子字符串的表達式。windows

1.正則表達式的基本目的就是查找目標字符串中符合表達式的 ‘子字符串’。app

1.1明確這個很重要。由於不一樣的語言會給表達式類附加不少功能和函數。match,find.等等。這些功能都是從這個基本目的引伸出來的。千萬別忘記了這些功能都是基於正則表達式的基本目的。ide

1.2並且明確了這個目的也會幫助理解正則語法中的^和$符號。記住^和$也是來找 ‘子字符串‘的，只不過^$同時出現，恰巧表達了總體匹配表達式的含義，表達出了 ‘子字符串’是總體字符串的特例的狀況。函數

理解^$同時出現的解釋：某個子串，必須開頭匹配表達式，並且結尾也必須匹配表達式，那麼若是存在匹配的子串，它也只能是整個字符串。學習

2.表達式的每一個符號的語法仍是要清晰的掌握。隨便看一眼，是懂非懂，無濟於事。

2.1 [ ] ,表達的是單個字符。因此才能夠[^xxx],來表示非某集合的單個符號。而 (||)，表達的選擇其中的字符串。(^||)是沒法表達非字符的意思的。由於這個語法沒法肯定非以後，你須要字符的長度。它不會表達非的語法。而是表達開頭匹配的意思。

要表達非子串，必須依賴預查功能，仔細想一想，(^||)，沒法表達長度，並且語法也沒有支持它表達任意長度。因此必須依賴否預查，

一段語法表示你要查的東西，附加一個預查功能，還有一個重點依然是第一要點。會有不少子串知足非子串的功能。

3.表達式默認的是貪婪模式，因此不少時候，咱們並無輸入^$, 但結果是整個字符串，而不是子串。當咱們明確整個全匹配，最好加上^$，而不要依賴貪婪模式，這有助於咱們理解正則表達式的本意。

　　還有貪婪模式的方向是貪婪的包含，而不是貪婪的非包含，因此再表達非的時候，每每表達式和咱們想要表達的意思不一樣。

以幾個例子來分析正則表達式。

經常使用語法

1. . 表明一個任意字符。 * 號不是通配符，在正則中，它是表示無限重複前面的表達式。它自己單獨是沒有做用的。

2. [ ] 表示的是選擇出一個單個字符。 ( ) 這個符號有不少組合，是最容易混淆的。 (| |) 表示選擇 . ()表示子表達式，用於分組，或者讓某些符號起做用如()*，讓子表達式能夠重複。 (?=) 又能夠表示斷言。

3. ^(?!.*apple).*$ 是否含有apple，含有返回位置0，不含有不返回數字。返回的數字，表示從那個位置開始進行下一個匹配。而咱們通常的表達式返回的是2個數字。表示這段區間是匹配的。從這段區間開始下一次表達式的匹配。

4. 斷言語法又是個有個性的表達式。後斷言，寫在某子表達式的後面。前斷言又須要寫在表達式的前面。太戲精了。都有不一樣的符號表達先後之分。爲何不都放在表達式的後面呢？

一。表示一個不包含apple 的字符串，該如何寫。

如字符串爲 this is an apple! 咱們如何寫一個表達式，讓他不匹配 'this is an apple!'
1.(^apple)
這裏^沒有表示非的意思。^只能和[]單個字符來組合。這裏的()表示了一個組，而不是選擇符號。^表示的是要開頭匹配表達式，也就是^符號的另一個語法含義。
我是如何知道的? 點這裏。https://regex101.com/r/IDDARt/76 輸入 (^apple) 這個表達式。它就會告訴你。這個網址是你掌握表達式的利器。
2.[^a][^p][^p][^l][^e]
這樣呢？那我一個一個組合啊。聰明嗎？毛線。仔細想一想[]表示的是一個字符。那麼這裏表示的是我要匹配5個字符，任意5個字符。只要1位置不是a，2位置不是p，3位置不是p,4l.5.e。若是隻有1或2個或6個以上字符。是不會匹配的。
3.再認真想一想，咱們的需求：表示一個不包含apple 的字符串。‘不包含apple’ 這個是一個修飾，而不是要找的東西。是否是很眼熟，這個不就是預查的語法意義嗎,?= ?! ?<= ?<!
3.1首先必須加上^$,由於不加的話是子串不包含apple，這個就太多匹配的了。不是咱們的本意，咱們要的是整個字符串不包含apple，而不是其中某子串不包含也能夠。
3.2 那這樣行不行？ ^.*(?!apple).*$ 。初看是能夠，其實也不行。由於正則表達式是貪婪匹配，能夠匹配不少。this is an apple!中，第一個 .* 能夠匹配 this is an app .那那麼後面只有le.也是符合表達式的。
3.3 想不出來，由於我是隱約記得有這個表達式，可是本身沒去認真看，想本身推寫出來。到這裏卡殼了。
3.4... 往前預查，能夠用.*來貪婪做弊。可是咱們能夠用日後預查吧。已經獲得的字符串，無法做弊吧。 ^.*(?<!apple)$ ，不行 ^.*(?<!apple).*$ 也不行。仔細思考。由於他不是準確表示了不包含的意思。
^.*(?<!apple)$ 這個能夠準確表示結尾不能是apple,但不是包含， ^.*(?<!apple).*$ 這個就離譜了，解釋器能夠能夠經過末尾的 .* ，對字符牀進行任何的切割來使他不包含apple。如這裏.*能夠表示ple!。又是做弊。
3.5 惟一想到的是 ^.*(?<!apple.*)$ 。可是它不是個合法的表達式。看別人的寫法吧。不想了。 ^((?!hede).)*$
3.6 ^((?!hede).)*$ ，某個字符的前面不包含hede，以後再對此類字符擴展。恩。沒想到還能這樣寫。由於.*以後再描述它的限制，會讓解釋器利用.*來暴力匹配合適的狀況。而 (?!hede). .讓解釋器只有一種解釋。恩。不錯。。。

3.7 本身作密碼驗證又發現一個更簡單的寫法。用空表達式的後查 ^(?!.*apple).*$ 。能夠匹配是否包含apple。並從0位置。開始繼續下面的匹配。

二，常見密碼驗證，必須包含大寫字母，小寫字母。長度9到16，並且只能是字母和數字。

^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z])[0-9a-zA-Z]{9,16}$

1.本身真是不容易才推出來。涉及到的語法細節，不少文章都沒有介紹。首先咱們的要求是必須包含。含有此意思的語法符號又是斷言語法(?xxx).可是想一想，斷言語法，是不包含斷言語句的。也就是匹配以後是不包含數字，字母的。這個。。。

2.因此這裏有個大部分文章沒有講的一個細節。若是 (?=) 以前，沒有表達式的話，那麼返回的不是匹配的子串，而是一個位置,position. (?=.*[0-9])，這個的意思是返回出現數字以前的位置，並且能夠有任意符號。那麼對於abc123456789A

會返回除下A以前的位置的全部位置。若是咱們加上^，那麼把匹配縮到0位置。全部 ^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]) 這個會匹配含有小寫，大寫，數字的字符串的0位置。

我是如何沒有了解相關介紹，而本身推出來的？

仍是咱們的利器。https://regex101.com/r/IDDARt/13 。本身寫例子。本身看右邊的解釋，一點一點測試推測，求證。

3.加上^返回了咱們匹配的其實位置。那麼這個時候纔開始寫匹配表達式。由於已經包含了大寫，小寫字母，數字。因此咱們的要求就變成了長度了。因此後面寫[0-9a-zA-Z]{9,16}$。結束。

4.再總結下，前面沒有表達式直接寫(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]) 會返回一個位置，告訴你符合這些預判條件的初始位置在那裏。由於咱們是要求初始位置必須是0.因此加上^,看看是否匹配，或者說去掉非0位置的其餘匹配。

獲得初始位置，就是咱們下面語句匹配的開始位置。咱們設定了爲0，也就是字符開頭。咱們只要長度和類型就能夠。因此[0-9a-zA-Z]{9,16}，而且必須包含結尾。$

5. 受這裏啓發。我發現表示不包含有個更簡潔的表示方法。 ^(?!.*apple).*$

3.省份證。

(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)

很簡單了。不解釋。

其實仔細看下正則表達式語法真的不多了。

正則表達式的所有語法字符。

元字符

元字符	描述
.	句號匹配任意單個字符除了換行符.
[ ]	字符種類. 匹配方括號內的任意字符.
[^ ]	否認的字符種類. 匹配除了方括號裏的任意字符
*	匹配>=0個重複的在*號以前的字符.
+	匹配>=1個重複的+號前的字符.
?	標記?以前的字符爲可選.
{n,m}	匹配num個大括號以前的字符 (n <= num <= m).
(xyz)	字符集, 匹配與 xyz 徹底相等的字符串.
\|	或運算符,匹配符號前或後的字符.
\	轉義字符,用於匹配一些保留的字符 `[ ] ( ) { } . * + ? ^ $ \ \|`
^	從開始行開始匹配.
$	從末端開始匹配.

簡寫字符集

正則表達式提供一些經常使用的字符集簡寫. 以下:

簡寫	描述
.	除換行符外的全部字符
\w	匹配全部字母數字, 等同於 `[a-zA-Z0-9_]`
\W	匹配全部非字母數字, 即符號, 等同於: `[^\w]`
\d	匹配數字: `[0-9]`
\D	匹配非數字: `[^\d]`
\s	匹配全部空格字符, 等同於: `[\t\n\f\r\p{Z}]`
\S	匹配全部非空格字符: `[^\s]`
\f	匹配一個換頁符
\n	匹配一個換行符
\r	匹配一個回車符
\t	匹配一個製表符
\v	匹配一個垂直製表符
\p	匹配 CR/LF (等同於 `\r\n`)，用來匹配 DOS 行終止符

零寬度斷言，

說人話：匹配表達式的附加條件，

我要找小紅旁邊的（斷言）男孩子。因此我要找的是男孩子，小紅的不要（零寬度）。

符號	描述
?=	正先行斷言-存在
?!	負先行斷言-排除
?<=	正後發斷言-存在
?<!	負後發斷言-排除

後面應該有

後面不該該有

前面應該有

前面不該該有

其餘語法規則

() ,表示分組，可用於後面來引用它，後向引用用於重複搜索前面某個分組匹配的文本。例如，\1表明分組1匹配的文本

\b(\w+)\b\s+\1\b能夠用來匹配重複的單詞，像go go, 或者kitty kitty。

下面列出了最經常使用的一些：

表4.經常使用分組語法
分類	代碼/語法	說明
捕獲	(exp)	匹配exp,並捕獲文本到自動命名的組裏
	(?<name>exp)	匹配exp,並捕獲文本到名稱爲name的組裏，也能夠寫成(?'name'exp)
	(?:exp)	匹配exp,不捕獲匹配的文本，也不給此分組分配組號
零寬斷言	(?=exp)	匹配exp前面的位置
	(?<=exp)	匹配exp後面的位置
	(?!exp)	匹配後面跟的不是exp的位置
	(?<!exp)	匹配前面不是exp的位置
註釋	(?#comment)	這種類型的分組不對正則表達式的處理產生任何影響，用於提供註釋讓人閱讀

最後還有平衡組/遞歸匹配

學習中途的理解

//思考一個表達式語法如何能夠表示任何東西?首先必須有語法表示：
//某子段表達式出現0到無數次。只有掌握重複本身的技能，纔有從有限到無限的可能。
//因此須要有1，表示子段的能力。2表示重複次數的能力。
//其次必須有1.表示某個符號的能力，2.表示任意符號的能力，3.表示某組符號中的一個的能力。那麼這樣的話，和前面的能力結合，理論上就能夠表示任何東西。
//固然擴展開來，有一個非符號，在某些狀況下，能夠表達更簡潔,特別注意非，首先是某個能夠表示肯定含義的語法（肯定的長度和符號範圍）才能去非。[]是肯定的語法，肯定了1長度。任意字符爲範圍。
//而對於匹配後的繼續子匹配，能夠在一次匹配中就表達出。須要擴展語法。java 用().
//其實 regex 晦澀就在於細節多，碎片學習的話，可能就會對於()的分組做用漏學。致使誤認爲是選擇含義，產生各類疑惑。由於各類組合表示能夠有多種語法表示，有的簡潔，有的複雜。因此加大了看懂別人表達式的難度。
//[]是單個字符含義，()是選擇和分組。{} 是表示重複概念。

1 . 校驗密碼強度

密碼的強度必須是包含大小寫字母和數字的組合，不能使用特殊字符，長度在8-10之間。

^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

2. 校驗中文

字符串僅能是中文。

^[\\u4e00-\\u9fa5]{0,}$

3. 由數字、26個英文字母或下劃線組成的字符串

^\\w+$

4. 校驗E-Mail 地址

同密碼同樣，下面是E-mail地址合規性的正則檢查語句。

[\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w-]*[\\w])?

5. 校驗身份證號碼

下面是身份證號碼的正則校驗。15 或 18位。

15位：
^[1-9]\\d{7}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}$
18位：
^[1-9]\\d{5}[1-9]\\d{3}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}([0-9]|X)$

6. 校驗日期

「yyyy-mm-dd「格式的日期校驗，已考慮平閏年。

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

7. 校驗金額

金額校驗，精確到2位小數。

^[0-9]+(.[0-9]{2})?$

8. 校驗手機號

下面是國內 1三、1五、18開頭的手機號正則表達式。（可根據目前國內收集號擴展前兩位開頭號碼）

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$

9. 判斷IE的版本

IE目前還沒被徹底取代，不少頁面仍是須要作版本兼容，下面是IE版本檢查的表達式。

^.*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$

10. 校驗IP-v4地址

IP4 正則語句。

\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b

11. 校驗IP-v6地址

IP6 正則語句。

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

12. 檢查URL的前綴

應用開發中不少時候須要區分請求是HTTPS仍是HTTP，經過下面的表達式能夠取出一個url的前綴而後再邏輯判斷。

if (!s.match(/^[a-zA-Z]+:\\/\\//))
{
    s = 'http://' + s;
}

13. 提取URL連接

下面的這個表達式能夠篩選出一段文本中的URL。

^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?

14. 文件路徑及擴展名校驗

驗證windows下文件路徑和擴展名（下面的例子中爲.txt文件）

^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$

15. 提取Color Hex Codes

有時須要抽取網頁中的顏色代碼，可使用下面的表達式。

^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$

16. 提取網頁圖片

倘若你想提取網頁中全部圖片信息，能夠利用下面的表達式。

\\< *[img][^\\\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)

17. 提取頁面超連接

提取html中的超連接。

(<a\\s*(?!.*\\brel=)[^>]*)(href="https?:\\/\\/)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list).'))[^"]+)"((?!.*\\brel=)[^>]*)(?:[^>]*)>

18. 查找CSS屬性

經過下面的表達式，能夠搜索到相匹配的CSS屬性。

^\\s*[a-zA-Z\\-]+\\s*[:]{1}\\s[a-zA-Z0-9\\s.#]+[;]{1}

19. 抽取註釋

若是你須要移除HMTL中的註釋，可使用以下的表達式。

<!--(.*?)-->

20. 匹配HTML標籤

經過下面的表達式能夠匹配出HTML中的標籤屬性。





<\\/?\\w+((\\s+\\w+(\\s*=\\s*(?:".*?"|'.*?'|[\\^'">\\s]+))?)+\\s*|\\s*)\\/?>

經常使用正則表達式

1、校驗數字的表達式

數字：^[0-9]*$
n位的數字：^\d{n}$
至少n位的數字：^\d{n,}$
m-n位的數字：^\d{m,n}$
零和非零開頭的數字：^(0|[1-9][0-9]*)$
非零開頭的最多帶兩位小數的數字：^([1-9][0-9]*)+(\.[0-9]{1,2})?$
帶1-2位小數的正數或負數：^(\-)?\d+(\.\d{1,2})$
正數、負數、和小數：^(\-|\+)?\d+(\.\d+)?$
有兩位小數的正實數：^[0-9]+(\.[0-9]{2})?$
有1~3位小數的正實數：^[0-9]+(\.[0-9]{1,3})?$
非零的正整數：^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
非零的負整數：^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
非負整數：^\d+$ 或 ^[1-9]\d*|0$
非正整數：^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
非負浮點數：^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
非正浮點數：^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
正浮點數：^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
負浮點數：^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
浮點數：^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

校驗字符的表達式

漢字：^[\u4e00-\u9fa5]{0,}$
英文和數字：^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
長度爲3-20的全部字符：^.{3,20}$
由26個英文字母組成的字符串：^[A-Za-z]+$
由26個大寫英文字母組成的字符串：^[A-Z]+$
由26個小寫英文字母組成的字符串：^[a-z]+$
由數字和26個英文字母組成的字符串：^[A-Za-z0-9]+$
由數字、26個英文字母或者下劃線組成的字符串：^\w+$ 或 ^\w{3,20}$
中文、英文、數字包括下劃線：^[\u4E00-\u9FA5A-Za-z0-9_]+$
中文、英文、數字但不包括下劃線等符號：^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
能夠輸入含有^%&',;=?$\"等字符：[^%&',;=?$\x22]+
禁止輸入含有~的字符：[^~\x22]+

3、特殊需求表達式

Email地址：^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
域名：[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
InternetURL：[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
手機號碼：^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX)：^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
國內電話號碼(0511-440522二、021-87888822)：\d{3}-\d{8}|\d{4}-\d{7}
電話號碼正則表達式（支持手機號碼，3-4位區號，7-8位直播號碼，1－4位分機號）: ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
身份證號(15位、18位數字)，最後一位是校驗位，可能爲數字或字符X：(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
賬號是否合法(字母開頭，容許5-16字節，容許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密碼(以字母開頭，長度在6~18之間，只能包含字母、數字和下劃線)：^[a-zA-Z]\w{5,17}$
強密碼(必須包含大小寫字母和數字的組合，不能使用特殊字符，長度在 8-10 之間)：^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
強密碼(必須包含大小寫字母和數字的組合，可使用特殊字符，長度在8-10之間)：^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
日期格式：^\d{4}-\d{1,2}-\d{1,2}
一年的12個月(01～09和1～12)：^(0?[1-9]|1[0-2])$
一個月的31天(01～09和1～31)：^((0?[1-9])|((1|2)[0-9])|30|31)$
錢的輸入格式：
1. 有四種錢的表示形式咱們能夠接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000"：^[1-9][0-9]*$
2. 這表示任意一個不以0開頭的數字,可是,這也意味着一個字符"0"不經過,因此咱們採用下面的形式：^(0|[1-9][0-9]*)$
3. 一個0或者一個不以0開頭的數字.咱們還能夠容許開頭有一個負號：^(0|-?[1-9][0-9]*)$
4. 這表示一個0或者一個可能爲負的開頭不爲0的數字.讓用戶以0開頭好了.把負號的也去掉,由於錢總不能是負的吧。下面咱們要加的是說明可能的小數部分：^[0-9]+(.[0-9]+)?$
5. 必須說明的是,小數點後面至少應該有1位數,因此"10."是不經過的,可是 "10" 和 "10.2" 是經過的：^[0-9]+(.[0-9]{2})?$
6. 這樣咱們規定小數點後面必須有兩位,若是你認爲太苛刻了,能夠這樣：^[0-9]+(.[0-9]{1,2})?$
7. 這樣就容許用戶只寫一位小數.下面咱們該考慮數字中的逗號了,咱們能夠這樣：^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
8. 1到3個數字,後面跟着任意個逗號+3個數字,逗號成爲可選,而不是必須：^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
9. 備註：這就是最終結果了,別忘了"+"能夠用"*"替代若是你以爲空字符串也能夠接受的話(奇怪,爲何?)最後,別忘了在用函數時去掉去掉那個反斜槓,通常的錯誤都在這裏
xml文件：^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
中文字符的正則表達式：[\u4e00-\u9fa5]
雙字節字符：[^\x00-\xff] (包括漢字在內，能夠用來計算字符串的長度(一個雙字節字符長度計2，ASCII字符計1))
空白行的正則表達式：\n\s*\r (能夠用來刪除空白行)
HTML標記的正則表達式：<(\S*?)[^>]*>.*?|<.*? /> ( 首尾空白字符的正則表達式：^\s*|\s*$或(^\s*)|(\s*$) (能夠用來刪除行首行尾的空白字符(包括空格、製表符、換頁符等等)，很是有用的表達式)
騰訊QQ號：[1-9][0-9]{4,} (騰訊QQ號從10000開始)
中國郵政編碼：[1-9]\d{5}(?!\d) (中國郵政編碼爲6位數字)
IP地址：((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))