ios 一個正則表達式測試（只可輸入中文、字母和數字）

時間 2019-11-11

標籤 ios 一個正則表達式測試只可輸入中文字母數字欄目 iOS 简体版

原文原文鏈接

一個正則表達式測試（只可輸入中文、字母和數字）

在項目中碰到了正則表達式的運用，正則仍是很是強大的，無論什麼編程語言，基本上均可以用到。以前在用java時特別是對用戶名或密碼使用正則很是爽，寫腳本上用正則也很是爽，但是到了OC這卻把我虐了一把，多是對OC掌握的不夠。這裏就羅列了從網上找的頗有用的資料，感謝大神們的貢獻。javascript

首先舉一個例子：
匹配9-15個由字母/數字組成的字符串的正則表達式：html

    NSString * regex = @"^[A-Za-z0-9]{9,15}$";
    NSPredicate *pred = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", regex];
    BOOL isMatch = [pred evaluateWithObject:txtfldPhoneNumber.text];

假如是在OC裏用，必定要注意細節。java

列出我在項目中用到的代碼：ios

    NSString *regex = @"[a-zA-Z\u4e00-\u9fa5][a-zA-Z0-9\u4e00-\u9fa5]+";
    NSPredicate *pred = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", regex];



if(![pred evaluateWithObject: nickNameTextField.text])
    {
        /*
         ////此動畫爲彈出buttonqww
        UIAlertView *alertView = [[UIAlertView alloc]initWithTitle:@"提示" message:@"暱稱只能由中文、字母或數字組成" delegate:self cancelButtonTitle:@"肯定" otherButtonTitles: nil];
        [alertView show];
        return;
         */
        
        Warning_boxes *reminderView = [[Warning_boxes alloc]init];
        [self.view addSubview:reminderView];
        reminderView.title_alter.text = @"暱稱只能由中文、字母或數字組成";
        [reminderView animationStart];
        [reminderView release];
        
        /*
         //此動畫爲在頂上顯示文字
        [MPNotificationView notifyWithText:@"暱稱只能由中文、字母或數字組成"
                               andDuration:0.5];
         */
        return;

下一行代碼很是關鍵：web

if(![pred evaluateWithObject: nickNameTextField.text])

這裏有！必定要注意。由於nickNameTextField.text和pred匹配的時候返回的是YES。因此在判斷他們匹配時的狀況要加！。正則表達式

要學好正則的小夥伴，強烈推薦：正則表達式30分鐘入門教程express

說明：正則表達式一般用於兩種任務：1.驗證，2.搜索/替換。用於驗證時，一般須要在先後分別加上^和$，以匹配整個待驗證字符串；搜索/替換時是否加上此限定則根據搜索的要求而定，此外，也有可能要在先後加上\b而不是^和$。此表所列的經常使用正則表達式，除個別外均未在先後加上任何限定，請根據須要，自行處理。編程

說明	正則表達式
網址（URL）	[a-zA-z]+://[^\s]*
IP地址(IP Address)	((2[0-4]\d\|25[0-5]\|[01]?\d\d?)\.){3}(2[0-4]\d\|25[0-5]\|[01]?\d\d?)
電子郵件(Email)	\w+([-+.]\w+)@\w+([-.]\w+)\.\w+([-.]\w+)*
QQ號碼	[1-9]\d{4,}
HTML標記(包含內容或自閉合)	<(.)(.)>.<\/\1>\|<(.) \/>
密碼(由數字/大寫字母/小寫字母/標點符號組成，四種都必有，8位以上)	(?=^.{8,}$)(?=.\d)(?=.\W+)(?=.[A-Z])(?=.[a-z])(?!.\n).$
日期(年-月-日)	(\d{4}\|\d{2})-((1[0-2])\|(0?[1-9]))-(([12][0-9])\|(3[01])\|(0?[1-9]))
日期(月/日/年)	((1[0-2])\|(0?[1-9]))/(([12][0-9])\|(3[01])\|(0?[1-9]))/(\d{4}\|\d{2})
時間(小時:分鐘, 24小時制)	((1\|0?)[0-9]\|2[0-3]):([0-5][0-9])
漢字(字符)	[\u4e00-\u9fa5]
中文及全角標點符號(字符)	[\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
中國大陸固定電話號碼	(\d{4}-\|\d{3}-)?(\d{8}\|\d{7})
中國大陸手機號碼	1\d{10}
中國大陸郵政編碼	[1-9]\d{5}
中國大陸身份證號(15位或18位)	\d{15}(\d\d[0-9xX])?
非負整數(正整數或零)	\d+
正整數	[0-9][1-9][0-9]
負整數	-[0-9][1-9][0-9]
整數	-?\d+
小數	(-?\d+)(\.\d+)?
不包含abc的單詞	\b((?!abc)\w)+\b

正則表達式：是指一個用來描述或者匹配一系列符合某個句法規則的字符串的單個字符串，簡單說，就是咱們寫個模板，而後去匹配字符串。數組

　　下面咱們來看看一些基本的正則表達式的語法：網絡

　　\：將下個字符標記爲一個特殊的字符、一個原義字符、一個向後引用或者一個八進制轉義符例如「\n」就是匹配一個換行符。

　　^：匹配開始位置，^(a)這個就匹配開頭必須爲a。

　　$：匹配結束位置，$(a)這個就匹配結尾必須爲a。

　　*：匹配前面的子表達式零次或者屢次，如「xu*」這個表達式就可以匹配「x」和「xuu」。

　　+：匹配前面的子表達式一次或者屢次，如「xu+」這個表達式就可以匹配「xuu」和「xu」，但不可以匹配「x」，這個就是和「*」的區別。

　　?：匹配前面的子表達式零次或者一次，如「xu？」這個表達式就可以匹配「jian(guo)?」就能夠匹配「jian」和「jianguo」。

　　{n}：n是一個非負數，匹配n次，如「guo{2}」，能夠匹配「guoo」，不能匹配「guo」。

　　{n,}：n是一個非負數，匹配至少n次。

　　{n, m}：m、n都是非負數，最少匹配n次，最多匹配m次。

　　(pattern)：匹配pattern並獲取匹配結果。

　　(?:pattern)：匹配pattern但不獲取匹配結果。

　　x|y：匹配x或y，如「(xu|jian)guo」匹配「xuguo」或者「jianguo」。

　　[xyz]：字符集合，匹配所包含的任意字符。如「[abc]」能夠匹配「apple」中的「a」。

　　[^xyz]：匹配未被包含的字符。

　　[a-z]：字符範圍，匹配指定範圍內的任意字符。

　　[^a-z]：匹配指定不在範圍內的任意字符。

　　\b：匹配一個單詞的邊界，如「guo\b」能夠匹配「xujianguo」中的「guo」。

　　\B：匹配非單詞邊界，如「jian\B」能夠匹配「xujianguo」中的「jian」。

　　\d：匹配一個數字字符，等價於「[0-9]」。

　　\D：匹配一個非數字字符。

　　\f：匹配一個換頁符。

　　\n：匹配一個換行符。

　　\r：匹配一個回車符。

　　\s：匹配任何空白字符

　　其實還有不少語法我就不一一列舉了，先說這麼多先

一.NSString自帶的正則查找,替換方法

正則查找方法
– rangeOfString:options:
– rangeOfString:options:range:
– rangeOfString:options:range:locale:

正則替換方法
– stringByReplacingOccurrencesOfString:withString:options:range:

options參數指定搜索選項,類型爲NSStringCompareOptions,可經過位或操做指定爲NSCaseInsensitiveSearch, NSLiteralSearch, NSBackwardsSearch, NSAnchoredSearch>等選項的組合。
若指定的選項爲NSRegularExpressionSearch,則搜索字符串被認爲是ICU兼容的正則表達式,若是指定了此選項,則與其能夠同時存在的選項只有NSCaseInsensitiveSearch和NSAnchoredSearch

二.使用RegexKitLite

RegexKitLite向標準NSString類增長了不少方法來使用正則表達式，RegexKitLite使用iOS系統自帶的ICU(International Components for Unicode)正則引擎處理正則表達式,因此RegexKitLite使用的正則語法爲ICU的語法，使用RegexKitLite須要導入libicucore.dylib庫。

使用RegexKitLite的方法很簡單，將RegexKitLite.h和RegexKitLite.m加入到工程，而後引入libicucore.dylib庫便可。
RegexKitLite.h RegexKitLite.m

RegexKitLit NSString方法參考
RegexKitLite NSString Additions Reference

RegexKitLite的使用說明見:
Using RegexKitLite

ICU正則語法爲:
ICU Syntax
ICU User Guide – Regular Expressions

三.使用RegexKit.framework框架

RegexKit Framework與RegexKitLite來自同一體系,但其更復雜和強大。RegexKit Framework不使用iOS系統的ICU正則庫，而是自帶 PCRE(Perl Compatible Regular Expressions)庫, 因此其正則語法是PCRE的語法。

RegexKit Framework功能很強大，其向NSArray,NSData,NSDictionary,NSSet和NSString對象增長了正則表達式的支持。

TRegexKit.framework與RegexKitLite的區別

	RegexKit.framework	RegexKitLite
Regex Library	PCRE	ICU
Library Included	Yes, built into framework object file.	No, provided by Mac OS X.
Library Linked As	Statically linked into framework.	Dynamically linked to/usr/lib/libicucore.dylib.
Compiled Size	Approximately 371KB^† per architecture.	Very small, approximately 16KB—20KB^‡ per architecture.
Style	External, linked to framework.	Compiled directly in to final executable.
Feature Set	Large, with additions to many classes.	Minimal, NSString only.

四.經常使用ICU正則匹配模式

經常使用的ICU正則匹配模式見:
RegexKitLite Cookbook

數字 Numbers

Description	Regex	Examples
Integer	[+\-]?[0-9]+	123-42+23
Hex Number	0[xX][0-9a-fA-F]+	0×00xdeadbeef0xF3
Floating Point	[+\-]?(?:[0-9]*\.[0-9]+\|[0-9]+\.)	123..123+.42
Floating Point with Exponent	[+\-]?(?:[0-9]*\.[0-9]+\|[0-9]+\.)(?:[eE][+\-]?[0-9]+)?	123..12310.0E131.23e-7
Comma Separated Number	[0-9]{1,3}(?:,[0-9]{3})*	421,2341,234,567
Comma Separated Number	[0-9]{1,3}(?:,[0-9]{3})*(?:\.[0-9]+)?	421,2341,234,567.89

文本文件 Text Files

Description	Regex
Empty Line	(?m:^$)
Empty or Whitespace Only Line	(?m-s:^\s*$)
Strip Leading Whitespace	(?m-s:^\s(.?)$)
Strip Trailing Whitespace	(?m-s:^(.?)\s$)
Strip Leading and Trailing Whitespace	(?m-s:^\s(.?)\s*$)
Quoted String, Can Span Multiple Lines, May Contain \"	"(?:[^"\\]+\|\\.)"
Quoted String, Single Line Only, May Contain \"	"(?:[^"\\\r\n]+\|\\[^\r\n])"
HTML Comment	(?s:<--.*?-->)
Perl / Shell Comment	(?m-s:#.*$)
C, C++, or ObjC Comment	(?m-s://.*$)
C, C++, or ObjC Comment and Leading Whitespace	(?m-s:\s//.$)
C, C++, or ObjC Comment	(?s:/\.?\*/)

網絡與URL相關 Network and URL

Description	Regex
HTTP	\bhttps?://[a-zA-Z0-9\-.]+(?:(?:/[a-zA-Z0-9\-._?,'+\&%$=~!():@\\])+)?
HTTP	\b(https?)://([a-zA-Z0-9\-.]+)((?:/[a-zA-Z0-9\-._?,'+\&%$=~!():@\\])+)?
HTTP	\b(https?)://(?:(\S+?)(?::(\S+?))?@)?([a-zA-Z0-9\-.]+)(?::(\d+))?((?:/[a-zA-Z0-9\-._?,'+\&%$=~!():@\\])+)?
E-Mail	\b([a-zA-Z0-9%_.+\-]+)@([a-zA-Z0-9.\-]+?\.[a-zA-Z]{2,6})\b
Hostname	\b(?:[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}?[a-zA-Z0-9]\.)+[a-zA-Z]{2,6}\b
IP	\b(?:\d{1,3}\.){3}\d{1,3}\b
IP with Optional Netmask	\b((?:\d{1,3}\.){3}\d{1,3})(?:/(\d{1,2}))?\b
IP or Hostname	\b(?:(?:\d{1,3}\.){3}\d{1,3}\|(?:[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}?[a-zA-Z0-9]\.)+[a-zA-Z]{2,6})\b

五.貪婪匹配與最小匹配

在正則表達式中單獨使用*或+時,默認是匹配儘量多的數據，即貪婪匹配。

*	Match zero or more times. Match as many times as possible.
+	Match one or more times. Match as many times as possible.

好比對 abcdefgabcdefg 使用abc(.*)g進行匹配，則捕獲到到的數據爲 defgabcdef。
若只想捕獲到第一個g,即只想獲得def,則須要使用最小匹配,在*或+後面加上?，即便用abc(.*?)g進行匹配。

*?	Match zero or more times. Match as few times as possible.
+?	Match one or more times. Match as few times as possible.

另外,在正則中用(…)包含內容是要捕獲的數據，若是隻要用(…)來引用group而不想捕獲則可以使用(?:…)。

(…)	Capturing parentheses. Range of input that matched the parenthesized subexpression is available after the match.

(?:…)	Non-capturing parentheses. Groups the included pattern, but does not provide capturing of matching text. Somewhat more efficient than capturing parentheses.

六.正則表達式書寫格式

在書寫正則表達式時，須要將\進行轉義，即寫成兩個\\。
例如匹配IP地址的正則表達式爲 \b(?:\d{1,3}\.){3}\d{1,3}\b,則在實際書寫時則爲

NSString *regex = @"\\b(?:\\d{1,3}\.){3}\\d{1,3}\\b";

參考:
iOS 開發中使用正則表達式－暨 RegexKitLite 庫的用法
 RegexKitLite Documentation
[perl]理解貪婪匹配和最小匹配之間的區別
 NSString Class Reference
ICU – International Components for Unicode

來源：http://blog.csdn.net/zeng11088/article/details/8766121

經常使用的第三方正則庫:

http://regexkit.sourceforge.net/RegexKitLite/index.html

匹配中文字符的正則表達式： [\u4e00-\u9fa5]
評註：匹配中文還真是個頭疼的事，有了這個表達式就好辦了

匹配雙字節字符(包括漢字在內)：[^\x00-\xff]
評註：能夠用來計算字符串的長度（一個雙字節字符長度計2，ASCII字符計1）

匹配空白行的正則表達式：\n\s*\r
評註：能夠用來刪除空白行

匹配HTML標記的正則表達式：<(\S*?)[^>]*>.*?</\1>|<.*? />
評註：網上流傳的版本太糟糕，上面這個也僅僅能匹配部分，對於複雜的嵌套標記依舊無能爲力

匹配首尾空白字符的正則表達式：^\s*|\s*$
評註：能夠用來刪除行首行尾的空白字符(包括空格、製表符、換頁符等等)，很是有用的表達式

匹配Email地址的正則表達式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
評註：表單驗證時很實用

匹配網址URL的正則表達式：[a-zA-z]+://[^\s]*
評註：網上流傳的版本功能頗有限，上面這個基本能夠知足需求

匹配賬號是否合法(字母開頭，容許5-16字節，容許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評註：表單驗證時很實用

匹配國內電話號碼：\d{3}-\d{8}|\d{4}-\d{7}
評註：匹配形式如 0511-4405222 或 021-87888822

匹配騰訊QQ號：[1-9][0-9]{4,}
評註：騰訊QQ號從10000開始

匹配中國郵政編碼：[1-9]\d{5}(?!\d)
評註：中國郵政編碼爲6位數字

匹配身份證：\d{15}|\d{18}
評註：中國的身份證爲15位或18位

匹配ip地址：\d+\.\d+\.\d+\.\d+
評註：提取ip地址時有用

匹配特定數字：
^[1-9]\d*$　　 //匹配正整數
^-[1-9]\d*$ 　 //匹配負整數
^-?[1-9]\d*$　　 //匹配整數
^[1-9]\d*|0$　 //匹配非負整數（正整數 + 0）
^-[1-9]\d*|0$　　 //匹配非正整數（負整數 + 0）
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$　　 //匹配正浮點數
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$　 //匹配負浮點數
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$　 //匹配浮點數
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$　　 //匹配非負浮點數（正浮點數 + 0）
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$　　//匹配非正浮點數（負浮點數 + 0）
評註：處理大量數據時有用，具體應用時注意修正

匹配特定字符串：
^[A-Za-z]+$　　//匹配由26個英文字母組成的字符串
^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字符串
^[a-z]+$　　//匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$　　//匹配由數字和26個英文字母組成的字符串
^\w+$　　//匹配由數字、26個英文字母或者下劃線組成的字符串

來源：http://www.cnblogs.com/xujh/archive/2008/08/21/1273525.html

再粘貼一些別人寫的。

1.只能輸入數字和英文的：
<input onkeyup="value=value.replace(/[\W]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" ID="Text1" NAME="Text1">

2.只能輸入數字的：
<input onkeyup="value=value.replace(/[^\d]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" ID="Text2" NAME="Text2">

3.只能輸入全角的：
<input onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))" ID="Text3" NAME="Text3">

4.只能輸入漢字的：
<input onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))" ID="Text4" NAME="Text4">

5.郵件地址驗證：
var regu = "^(([0-9a-zA-Z]+)|([0-9a-zA-Z]+[_.0-9a-zA-Z-]*[0-9a-zA-Z]+))@([a-zA-Z0-9-]+[.])+([a-zA-Z]{2}|net|NET|com|COM|gov|GOV|mil|MIL|org|ORG|edu|EDU|int|INT)$"
var re = new RegExp(regu);
if (s.search(re) != -1) {
return true;
} else {
window.alert ("請輸入有效合法的E-mail地址！")
return false;
}

6.身份證：
"^\\d{17}(\\d|x)$"

7.17種正則表達式
"^\\d+$"　　//非負整數（正整數 + 0）
"^[0-9]*[1-9][0-9]*$"　　//正整數
"^((-\\d+)|(0+))$"　　//非正整數（負整數 + 0）
"^-[0-9]*[1-9][0-9]*$"　　//負整數
"^-?\\d+$"　　　　//整數
"^\\d+(\\.\\d+)?$"　　//非負浮點數（正浮點數 + 0）
"^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$"　　//正浮點數
"^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$"　　//非正浮點數（負浮點數 + 0）
"^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"　　//負浮點數
"^(-?\\d+)(\\.\\d+)?$"　　//浮點數
"^[A-Za-z]+$"　　//由26個英文字母組成的字符串
"^[A-Z]+$"　　//由26個英文字母的大寫組成的字符串
"^[a-z]+$"　　//由26個英文字母的小寫組成的字符串
"^[A-Za-z0-9]+$"　　//由數字和26個英文字母組成的字符串
"^\\w+$"　　//由數字、26個英文字母或者下劃線組成的字符串
"^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+$"　　　　//email地址
"^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$"　　//url

=============================================

1.取消按鈕按下時的虛線框
　　在input裏添加屬性值  hideFocus 或者 HideFocus=true

2.只讀文本框內容
  在input裏添加屬性值  readonly

3.防止退後清空的TEXT文檔(可把style內容作作爲類引用)
　　<INPUT style=behavior:url(#default#savehistory); type=text id=oPersistInput>

4.ENTER鍵可讓光標移到下一個輸入框
　　<input onkeydown="if(event.keyCode==13)event.keyCode=9" >

5.只能爲中文(有閃動)
　　<input onkeyup="value="/value.replace(/[" -~]/g,’’)" onkeydown="if(event.keyCode==13)event.keyCode=9">

6.只能爲數字(有閃動)
　　<input onkeyup="value="/value.replace(/["^\d] /g,’’) "onbeforepaste="clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^\d]/g,’’))">

7.只能爲數字(無閃動)
　　<input ime- mode:disabled" onkeydown="if(event.keyCode==13)event.keyCode=9" onKeyPress="if ((event.keyCode<48 || event.keyCode>57)) event.returnValue=false">

8.只能輸入英文和數字(有閃動)
　　<input onkeyup="value="/value.replace(/[\W] /g,"’’)" onbeforepaste="clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^\d]/g,’’))">

9.屏蔽輸入法
　　<input type="text" name="url" ime-mode:disabled" onkeydown="if(event.keyCode==13)event.keyCode=9">

10. 只能輸入數字，小數點，減號（-）字符(無閃動)
　　<input onKeyPress="if (event.keyCode!=46 && amp; event.keyCode!=45 && (event.keyCode<48 || event.keyCode>57)) event.returnValue=false">

11. 只能輸入兩位小數，三位小數(有閃動)
　　<input maxlength=9 onkeyup="if(value.match(/^\d{3}$/))value=" /value.replace(value,parseInt(value/10))" ;value="/value.replace(/\.\d*\./g,’."’)" onKeyPress="if((event.keyCode<48 || event.keyCode>57) && event.keyCode!=46 && event.keyCode!=45 || value.match(/^\d{3}$/) || /\.\d{3}$/.test(value)) {event.returnValue=false}" id=text_kfxe name=text_kfxe>

javascript正則表達式使用詳解

簡介

簡單的說，正則表達式是一種能夠用於模式匹配和替換的強有力的工具。其做用以下：
測試字符串的某個模式。例如，能夠對一個輸入字符串進行測試，看在該字符串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱爲數據有效性驗證。
替換文本。能夠在文檔中使用一個正則表達式來標識特定文字，而後能夠所有將其刪除，或者替換爲別的文字。
根據模式匹配從字符串中提取一個子字符串。能夠用來在文本或輸入字段中查找特定文字。

基本語法

在對正則表達式的功能和做用有了初步的瞭解以後，咱們就來具體看一下正則表達式的語法格式。

正則表達式的形式通常以下：　　

/love/　　其中位於「/」定界符之間的部分就是將要在目標對象中進行匹配的模式。用戶只要把但願查找匹配對象的模式內容放入「/」定界符之間便可。爲了可以使用戶更加靈活的定製模式內容，正則表達式提供了專門的「元字符」。所謂元字符就是指那些在正則表達式中具備特殊意義的專用字符，能夠用來規定其前導字符（即位於元字符前面的字符）在目標對象中的出現模式。
較爲經常使用的元字符包括：「+」，「*」，以及「?」。

「+」元字符規定其前導字符必須在目標對象中連續出現一次或屢次。

「*」元字符規定其前導字符必須在目標對象中出現零次或連續屢次。

「?」元字符規定其前導對象必須在目標對象中連續出現零次或一次。

下面，就讓咱們來看一下正則表達式元字符的具體應用。

/fo+/　　由於上述正則表達式中包含「+」元字符，表示能夠與目標對象中的「fool」, 「fo」, 或者「football」等在字母f後面連續出現一個或多個字母o的字符串相匹配。

/eg*/　　由於上述正則表達式中包含「*」元字符，表示能夠與目標對象中的「easy」, 「ego」, 或者「egg」等在字母e後面連續出現零個或多個字母g的字符串相匹配。

/Wil?/　　由於上述正則表達式中包含「？」元字符，表示能夠與目標對象中的「Win」, 或者「Wilson」,等在字母i後面連續出現零個或一個字母l的字符串相匹配。

有時候不知道要匹配多少字符。爲了能適應這種不肯定性，正則表達式支持限定符的概念。這些限定符能夠指定正則表達式的一個給定組件必需要出現多少次才能知足匹配。

{n} n 是一個非負整數。匹配肯定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，可是能匹配 "food" 中的兩個 o。

{n,} n 是一個非負整數。至少匹配 n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的全部 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。

{n,m} m 和 n 均爲非負整數，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，"o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。

除了元字符以外，用戶還能夠精確指定模式在匹配對象中出現的頻率。例如，/jim {2,6}/ 上述正則表達式規定字符m能夠在匹配對象中連續出現2-6次，所以，上述正則表達式能夠同jimmy或jimmmmmy等字符串相匹配。
在對如何使用正則表達式有了初步瞭解以後，咱們來看一下其它幾個重要的元字符的使用方式。

代碼

\s：用於匹配單個空格符，包括tab鍵和換行符；
\S：用於匹配除單個空格符以外的全部字符；
\d：用於匹配從0到9的數字；
\w：用於匹配字母，數字或下劃線字符；
\W：用於匹配全部與\w不匹配的字符；
. ：用於匹配除換行符以外的全部字符。

（說明：咱們能夠把\s和\S以及\w和\W看做互爲逆運算）
下面，咱們就經過實例看一下如何在正則表達式中使用上述元字符。
/\s+/ 上述正則表達式能夠用於匹配目標對象中的一個或多個空格字符。
/\d000/　若是咱們手中有一份複雜的財務報表，那麼咱們能夠經過上述正則表達式垂手可得的查找到全部總額達千元的款項。
除了咱們以上所介紹的元字符以外，正則表達式中還具備另一種較爲獨特的專用字符，即定位符。定位符用於規定匹配模式在目標對象中的出現位置。較爲經常使用的定位符包括：「^」, 「$」, 「\b」以及「\B」。

代碼

「^」定位符規定匹配模式必須出如今目標字符串的開頭
「$」定位符規定匹配模式必須出如今目標對象的結尾
「\b」定位符規定匹配模式必須出如今目標字符串的開頭或結尾的兩個邊界之一
「\B」定位符則規定匹配對象必須位於目標字符串的開頭和結尾兩個邊界以內，
即匹配對象既不能做爲目標字符串的開頭，也不能做爲目標字符串的結尾。

一樣，咱們也能夠把「^」和「$」以及「\b」和「\B」看做是互爲逆運算的兩組定位符。舉例來講： /^hell/　由於上述正則表達式中包含「^」定位符，因此能夠與目標對象中以「hell」, 「hello」或「hellhound」開頭的字符串相匹配。 /ar$/　由於上述正則表達式中包含「$」定位符，因此能夠與目標對象中以「car」, 「bar」或「ar」結尾的字符串相匹配。 /\bbom/　由於上述正則表達式模式以「\b」定位符開頭，因此能夠與目標對象中以「bomb」, 或「bom」開頭的字符串相匹配。/man\b/　由於上述正則表達式模式以「\b」定位符結尾，因此能夠與目標對象中以「human」, 「woman」或「man」結尾的字符串相匹配。
爲了可以方便用戶更加靈活的設定匹配模式，正則表達式容許使用者在匹配模式中指定某一個範圍而不侷限於具體的字符。例如：

代碼

/[A-Z]/　　上述正則表達式將會與從A到Z範圍內任何一個大寫字母相匹配。
/[a-z]/　　上述正則表達式將會與從a到z範圍內任何一個小寫字母相匹配。
/[0-9]/ 　上述正則表達式將會與從0到9範圍內任何一個數字相匹配。
/([a-z][A-Z][0-9])+/　上述正則表達式將會與任何由字母和數字組成的字符串，如「aB0」等相匹配。

這裏須要提醒用戶注意的一點就是能夠在正則表達式中使用「()」把字符串組合在一塊兒。「()」符號包含的內容必須同時出如今目標對象中。所以，上述正則表達式將沒法與諸如「abc」等的字符串匹配，由於「abc」中的最後一個字符爲字母而非數字。
若是咱們但願在正則表達式中實現相似編程邏輯中的「或」運算，在多個不一樣的模式中任選一個進行匹配的話，可使用管道符「|」。例如：/to|too|2/　上述正則表達式將會與目標對象中的「to」, 「too」, 或「2」相匹配。
正則表達式中還有一個較爲經常使用的運算符，即否認符「[^]」。與咱們前文所介紹的定位符「^」不一樣，否認符「[^]」規定目標對象中不能存在模式中所規定的字符串。例如：/[^A-C]/　上述字符串將會與目標對象中除A，B，和C以外的任何字符相匹配。通常來講，當「^」出如今「[]」內時就被視作否認運算符；而當「^」位於「[]」以外，或沒有「[]」時，則應當被視作定位符。
最後，當用戶須要在正則表達式的模式中加入元字符，並查找其匹配對象時，可使用轉義符「\」。例如：/Th\*/ 　上述正則表達式將會與目標對象中的「Th*」而非「The」等相匹配。
在構造正則表達式以後，就能夠象數學表達式同樣來求值，也就是說，能夠從左至右並按照一個優先級順序來求值。優先級以下：

代碼

1．\ 轉義符
2．(), (?:), (?=), [] 圓括號和方括號
3．*, +, ?, {n}, {n,}, {n,m} 限定符
4．^, $, \anymetacharacter 位置和順序
5．|「或」操做

使用實例
在JavaScript 1.2中帶有一個功能強大的RegExp()對象，能夠用來進行正則表達式的匹配操做。其中的test()方法能夠檢驗目標對象中是否包含匹配模式，並相應的返回true或false。
咱們可使用JavaScript編寫如下腳本，驗證用戶輸入的郵件地址的有效性。

代碼

<html>
<head>
　 <script language="Javascript1.2">
<!-- start hiding
　　　　 function verifyAddress(obj)
　　　　　{
　　　　　　var email = obj.email.value;
　　　　　　var pattern =
/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/;
　　　　　　flag = pattern.test(email);
　　　　　　if(flag)
　　　　　　{
　　　　　　　alert(「Your email address is correct!」);
　　　　　　　return true;
　　　　　　}
　　　　　　else
　　　　　　　{
　　　　　　　　alert(「Please try again!」);
　　　　　　　　return false;
　　　　　　　 }
　　　　　 }
　　　　 // stop hiding -->
　　　 </script>
　　</head>
　 <body>
　　 <form onSubmit="return verifyAddress(this);">
　　　 <input name="email" type="text">
　　　 <input type="submit">
　　　 </form>
　　</body>
</html>

正則表達式對象
本對象包含正則表達式模式以及代表如何應用模式的標誌。

代碼

語法 1 re = /pattern/[flags]
語法 2 re = new RegExp("pattern",["flags"])

參數
re
必選項。將要賦值爲正則表達式模式的變量名。

Pattern
必選項。要使用的正則表達式模式。若是使用語法 1，用 "/" 字符分隔模式。若是用語法 2，用引號將模式引發來。

Flags
可選項。若是使用語法 2 要用引號將 flag 引發來。標誌能夠組合使用，可用的有：

代碼

g （全文查找出現的全部 pattern）
i （忽略大小寫）
m （多行查找）

示例
下面的示例建立一個包含正則表達式模式及相關標誌的對象(re)，向您演示正則表達式對象的用法。在本例中，做爲結果的正則表達式對象又用於 match 方法中：

代碼

function MatchDemo()
{
var r, re; // 聲明變量。
var s = "The rain in Spain falls mainly in the plain";
re = new RegExp("ain","g"); // 建立正則表達式對象。
r = s.match(re); // 在字符串 s 中查找匹配。
return(r);
}

exec 方法
用正則表達式模式在字符串中運行查找，並返回包含該查找結果的一個數組。
rgExp.exec(str)

參數

rgExp
必選項。包含正則表達式模式和可用標誌的正則表達式對象。

str
必選項。要在其中執行查找的 String 對象或字符串文字。

說明\\
若是 exec 方法沒有找到匹配，則它返回 null。若是它找到匹配，則 exec 方法返回一個數組，而且更新全局 RegExp 對象的屬性，以反映匹配結果。數組的0元素包含了完整的匹配，而第1到n元素中包含的是匹配中出現的任意一個子匹配。這至關於沒有設置全局標誌 (g) 的 match 方法。
若是爲正則表達式設置了全局標誌，exec 從以 lastIndex 的值指示的位置開始查找。若是沒有設置全局標誌，exec 忽略 lastIndex 的值，從字符串的起始位置開始搜索。

exec 方法返回的數組有三個屬性，分別是 input、index 和 lastIndex。Input 屬性包含了整個被查找的字符串。Index 屬性中包含了整個被查找字符串中被匹配的子字符串的位置。LastIndex 屬性中包含了匹配中最後一個字符的下一個位置。

示例\\
下面的例子舉例說明了 exec 方法的用法：

代碼

function RegExpTest()
{
var ver = Number(ScriptEngineMajorVersion() + "." + ScriptEngineMinorVersion())
if (ver >= 5.5){ // 測試 JScript 的版本。
var src = "The rain in Spain falls mainly in the plain.";
var re = /\w+/g; // 建立正則表達式模式。
var arr;
while ((arr = re.exec(src)) != null)
document.write(arr.index + "-" + arr.lastIndex + arr + "\t");
}
else{
alert("請使用 JScript 的更新版本");
}
}

返回值：0-3The 4-8rain 9-11in 12-17Spain 18-23falls 24-30mainly 31-33in 34-37the 38-43plain

test 方法\\
返回一個 Boolean 值，它指出在被查找的字符串中是否存在模式。
rgexp.test(str)

參數\\
rgexp
必選項。包含正則表達式模式或可用標誌的正則表達式對象。

str
必選項。要在其上測試查找的字符串。

說明
test 方法檢查在字符串中是否存在一個模式，若是存在則返回 true，不然就返回 false。
全局 RegExp 對象的屬性不禁 test 方法來修改。

示例
下面的例子舉例說明了 test 方法的用法：

代碼

function TestDemo(re, s)
{
var s1; // 聲明變量。
// 檢查字符串是否存在正則表達式。
if (re.test(s)) // 測試是否存在。
s1 = " contains "; // s 包含模式。
else
s1 = " does not contain "; // s 不包含模式。
return("'" + s + "'" + s1 + "'"+ re.source + "'"); // 返回字符串。
}

函數調用：document.write (TestDemo(/ain+/ ,"The rain in Spain falls mainly in the plain."));

返回值：'The rain in Spain falls mainly in the plain.' contains 'ain+'

match 方法
使用正則表達式模式對字符串執行查找，並將包含查找的結果做爲數組返回。\\
stringObj.match(rgExp)

參數\\
stringObj
必選項。對其進行查找的 String 對象或字符串文字。

rgExp
必選項。爲包含正則表達式模式和可用標誌的正則表達式對象。也能夠是包含正則表達式模式和可用標誌的變量名或字符串文字。

說明\\
若是 match 方法沒有找到匹配，返回 null。若是找到匹配返回一個數組而且更新全局 RegExp 對象的屬性以反映匹配結果。
match 方法返回的數組有三個屬性：input、index 和 lastIndex。Input 屬性包含整個的被查找字符串。Index 屬性包含了在整個被查找字符串中匹配的子字符串的位置。LastIndex 屬性包含了最後一次匹配中最後一個字符的下一個位置。
若是沒有設置全局標誌 (g)，數組的 0 元素包含整個匹配，而第 1 到 n 元素包含了匹配中曾出現過的任一個子匹配。這至關於沒有設置全局標誌的 exec 方法。若是設置了全局標誌，元素 0 到 n 中包含全部匹配。

示例\\
下面的示例演示了match 方法的用法：

代碼

function MatchDemo()
{
var r, re; // 聲明變量。
var s = "The rain in Spain falls mainly in the plain";
re = /ain/i; // 建立正則表達式模式。
r = s.match(re); // 嘗試匹配搜索字符串。
return(r); // 返回第一次出現 "ain" 的地方。
}

返回值：ain

本示例說明帶 g 標誌設置的 match 方法的用法。

代碼

function MatchDemo()
{
var r, re; // 聲明變量。
var s = "The rain in Spain falls mainly in the plain";
re = /ain/ig; // 建立正則表達式模式。
r = s.match(re); // 嘗試去匹配搜索字符串。
return(r); // 返回的數組包含了全部 "ain"
// 出現的四個匹配。
}

返回值：ain,ain,ain,ain

上面幾行代碼演示了字符串文字的 match 方法的用法。

代碼

var r, re = "Spain";
r = "The rain in Spain".replace(re, "Canada");
return r;

返回值：The rain in Canada

search 方法
返回與正則表達式查找內容匹配的第一個子字符串的位置。

stringObj.search(rgExp)

參數\\
stringObj
必選項。要在其上進行查找的 String 對象或字符串文字。

rgExp
必選項。包含正則表達式模式和可用標誌的正則表達式對象。

說明

search 方法指明是否存在相應的匹配。若是找到一個匹配，search 方法將返回一個整數值，指明這個匹配距離字符串開始的偏移位置。若是沒有找到匹配，則返回 -1。

示例\\
下面的示例演示了 search 方法的用法。

代碼

function SearchDemo()
{
var r, re; // 聲明變量。
var s = "The rain in Spain falls mainly in the plain.";
re = /falls/i; // 建立正則表達式模式。
r = s.search(re); // 查找字符串。
return(r); // 返回 Boolean 結果。
}

返回值：18

正則表達式語法
一個正則表達式就是由普通字符（例如字符 a 到 z）以及特殊字符（稱爲元字符）組成的文字模式。該模式描述在查找文字主體時待匹配的一個或多個字符串。正則表達式做爲一個模板，將某個字符模式與所搜索的字符串進行匹配。

這裏有一些可能會遇到的正則表達式示例：

代碼

JScript VBScript 匹配
/^\[ \t]*$/ "^\[ \t]*$" 匹配一個空白行。
/\d{2}-\d{5}/ "\d{2}-\d{5}" 驗證一個ID 號碼是否由一個2位數字，一個連字符以及一個5位數字組成。
/<(.*)>.*<\/\1>/ "<(.*)>.*<\/\1>" 匹配一個 HTML 標記。

下表是元字符及其在正則表達式上下文中的行爲的一個完整列表：

字符描述
\ 將下一個字符標記爲一個特殊字符、或一個原義字符、或一個後向引用、或一個八進制轉義符。例如，'n' 匹配字符 "n"。'\n' 匹配一個換行符。序列 '\\' 匹配 "\" 而 "\(" 則匹配 "("。

^ 匹配輸入字符串的開始位置。若是設置了 RegExp 對象的 Multiline 屬性，^ 也匹配 '\n' 或 '\r' 以後的位置。

$ 匹配輸入字符串的結束位置。若是設置了RegExp 對象的 Multiline 屬性，$ 也匹配 '\n' 或 '\r' 以前的位置。

* 匹配前面的子表達式零次或屢次。例如，zo* 能匹配 "z" 以及 "zoo"。 * 等價於{0,}。

+ 匹配前面的子表達式一次或屢次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等價於 {1,}。

? 匹配前面的子表達式零次或一次。例如，"do(es)?" 能夠匹配 "do" 或 "does" 中的"do" 。? 等價於 {0,1}。

{n} n 是一個非負整數。匹配肯定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，可是能匹配 "food" 中的兩個 o。

{n,} n 是一個非負整數。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的全部 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。

{n,m} m 和 n 均爲非負整數，其中n <= m。最少匹配 n 次且最多匹配 m 次。劉， "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。

? 當該字符緊跟在任何一個其餘限制符 (*, +, ?, {n}, {n,}, {n,m}) 後面時，匹配模式是非貪婪的。非貪婪模式儘量少的匹配所搜索的字符串，而默認的貪婪模式則儘量多的匹配所搜索的字符串。例如，對於字符串 "oooo"，'o+?' 將匹配單個 "o"，而 'o+' 將匹配全部 'o'。

. 匹配除 "\n" 以外的任何單個字符。要匹配包括 '\n' 在內的任何字符，請使用象 '[.\n]' 的模式。
(pattern) 匹配pattern 並獲取這一匹配。所獲取的匹配能夠從產生的 Matches 集合獲得，在VBScript 中使用 SubMatches 集合，在JScript 中則使用 $0…$9 屬性。要匹配圓括號字符，請使用 '$' 或 '$'。

(?:pattern) 匹配 pattern 但不獲取匹配結果，也就是說這是一個非獲取匹配，不進行存儲供之後使用。這在使用 "或" 字符 (|) 來組合一個模式的各個部分是頗有用。例如， 'industr(?:y|ies) 就是一個比 'industry|industries' 更簡略的表達式。

(?=pattern) 正向預查，在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配，也就是說，該匹配不須要獲取供之後使用。例如， 'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ，但不能匹配 "Windows 3.1" 中的 "Windows"。預查不消耗字符，也就是說，在一個匹配發生後，在最後一次匹配以後當即開始下一次匹配的搜索，而不是從包含預查的字符以後開始。

(?!pattern) 負向預查，在任何不匹配Negative lookahead matches the search string at any point where a string not matching pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配，也就是說，該匹配不須要獲取供之後使用。例如'Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows"，但不能匹配 "Windows 2000" 中的 "Windows"。預查不消耗字符，也就是說，在一個匹配發生後，在最後一次匹配以後當即開始下一次匹配的搜索，而不是從包含預查的字符以後開始

x|y 匹配 x 或 y。例如，'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或 "food"。

[xyz] 字符集合。匹配所包含的任意一個字符。例如， '[abc]' 能夠匹配 "plain" 中的 'a'。

[^xyz] 負值字符集合。匹配未包含的任意字符。例如， '[^abc]' 能夠匹配 "plain" 中的'p'。

[a-z] 字符範圍。匹配指定範圍內的任意字符。例如，'[a-z]' 能夠匹配 'a' 到 'z' 範圍內的任意小寫字母字符。

[^a-z] 負值字符範圍。匹配任何不在指定範圍內的任意字符。例如，'[^a-z]' 能夠匹配任何不在 'a' 到 'z' 範圍內的任意字符。

\b 匹配一個單詞邊界，也就是指單詞和空格間的位置。例如， 'er\b' 能夠匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。

\B 匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。

\cx 匹配由x指明的控制字符。例如， \cM 匹配一個 Control-M 或回車符。 x 的值必須爲 A-Z 或 a-z 之一。不然，將 c 視爲一個原義的 'c' 字符。

\d 匹配一個數字字符。等價於 [0-9]。

\D 匹配一個非數字字符。等價於 [^0-9]。

\f 匹配一個換頁符。等價於 \x0c 和 \cL。

\n 匹配一個換行符。等價於 \x0a 和 \cJ。

\r 匹配一個回車符。等價於 \x0d 和 \cM。

\s 匹配任何空白字符，包括空格、製表符、換頁符等等。等價於 [ \f\n\r\t\v]。

\S 匹配任何非空白字符。等價於 [^ \f\n\r\t\v]。

\t 匹配一個製表符。等價於 \x09 和 \cI。

\v 匹配一個垂直製表符。等價於 \x0b 和 \cK。

\w 匹配包括下劃線的任何單詞字符。等價於'[A-Za-z0-9_]'。

\W 匹配任何非單詞字符。等價於 '[^A-Za-z0-9_]'。

\xn 匹配 n，其中 n 爲十六進制轉義值。十六進制轉義值必須爲肯定的兩個數字長。例如， '\x41' 匹配 "A"。'\x041' 則等價於 '\x04' & "1"。正則表達式中可使用 ASCII 編碼。.

\num 匹配 num，其中 num 是一個正整數。對所獲取的匹配的引用。例如，'(.)\1' 匹配兩個連續的相同字符。

\n 標識一個八進制轉義值或一個後向引用。若是 \n 以前至少 n 個獲取的子表達式，則 n 爲後向引用。不然，若是 n 爲八進制數字 (0-7)，則 n 爲一個八進制轉義值。

\nm 標識一個八進制轉義值或一個後向引用。若是 \nm 以前至少有is preceded by at least nm 個獲取得子表達式，則 nm 爲後向引用。若是 \nm 以前至少有 n 個獲取，則 n 爲一個後跟文字 m 的後向引用。若是前面的條件都不知足，若 n 和 m 均爲八進制數字 (0-7)，則 \nm 將匹配八進制轉義值 nm。

\nml 若是 n 爲八進制數字 (0-3)，且 m 和 l 均爲八進制數字 (0-7)，則匹配八進制轉義值 nml。

\un 匹配 n，其中 n 是一個用四個十六進制數字表示的 Unicode 字符。例如， \u00A9 匹配版權符號 (?)。

優先權順序
在構造正則表達式以後，就能夠象數學表達式同樣來求值，也就是說，能夠從左至右並按照一個優先權順序來求值。

下表從最高優先級到最低優先級列出各類正則表達式操做符的優先權順序：

代碼