在項目中碰到了正則表達式的運用,正則仍是很是強大的,無論什麼編程語言,基本上均可以用到。以前在用java時特別是對用戶名或密碼使用正則很是爽,寫 腳本上用正則也很是爽,但是到了OC這卻把我虐了一把,多是對OC掌握的不夠。這裏就羅列了從網上找的頗有用的資料,感謝大神們的貢獻。javascript
首先舉一個例子:
匹配9-15個由字母/數字組成的字符串的正則表達式:html
NSString * regex = @"^[A-Za-z0-9]{9,15}$"; NSPredicate *pred = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", regex]; BOOL isMatch = [pred evaluateWithObject:txtfldPhoneNumber.text];
假如是在OC裏用,必定要注意細節。java
列出我在項目中用到的代碼:ios
NSString *regex = @"[a-zA-Z\u4e00-\u9fa5][a-zA-Z0-9\u4e00-\u9fa5]+"; NSPredicate *pred = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", regex]; if(![pred evaluateWithObject: nickNameTextField.text]) { /* ////此動畫爲彈出buttonqww UIAlertView *alertView = [[UIAlertView alloc]initWithTitle:@"提示" message:@"暱稱只能由中文、字母或數字組成" delegate:self cancelButtonTitle:@"肯定" otherButtonTitles: nil]; [alertView show]; return; */ Warning_boxes *reminderView = [[Warning_boxes alloc]init]; [self.view addSubview:reminderView]; reminderView.title_alter.text = @"暱稱只能由中文、字母或數字組成"; [reminderView animationStart]; [reminderView release]; /* //此動畫爲在頂上顯示文字 [MPNotificationView notifyWithText:@"暱稱只能由中文、字母或數字組成" andDuration:0.5]; */ return;
下一行代碼很是關鍵:web
if(![pred evaluateWithObject: nickNameTextField.text])
這裏有!必定要注意。由於nickNameTextField.text和pred匹配的時候返回的是YES。因此在判斷他們匹配時的狀況要加!。正則表達式
要學好正則的小夥伴,強烈推薦:正則表達式30分鐘入門教程express
說 明:正則表達式一般用於兩種任務:1.驗證,2.搜索/替換。用於驗證時,一般須要在先後分別加上^和$,以匹配整個待驗證字符串;搜索/替換時是否加上 此限定則根據搜索的要求而定,此外,也有可能要在先後加上\b而不是^和$。此表所列的經常使用正則表達式,除個別外均未在先後加上任何限定,請根據須要,自 行處理。編程
說明 | 正則表達式 |
---|---|
網址(URL) | [a-zA-z]+://[^\s]* |
IP地址(IP Address) | ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?) |
電子郵件(Email) | \w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* |
QQ號碼 | [1-9]\d{4,} |
HTML標記(包含內容或自閉合) | <(.*)(.*)>.*<\/\1>|<(.*) \/> |
密碼(由數字/大寫字母/小寫字母/標點符號組成,四種都必有,8位以上) | (?=^.{8,}$)(?=.*\d)(?=.*\W+)(?=.*[A-Z])(?=.*[a-z])(?!.*\n).*$ |
日期(年-月-日) | (\d{4}|\d{2})-((1[0-2])|(0?[1-9]))-(([12][0-9])|(3[01])|(0?[1-9])) |
日期(月/日/年) | ((1[0-2])|(0?[1-9]))/(([12][0-9])|(3[01])|(0?[1-9]))/(\d{4}|\d{2}) |
時間(小時:分鐘, 24小時制) | ((1|0?)[0-9]|2[0-3]):([0-5][0-9]) |
漢字(字符) | [\u4e00-\u9fa5] |
中文及全角標點符號(字符) | [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee] |
中國大陸固定電話號碼 | (\d{4}-|\d{3}-)?(\d{8}|\d{7}) |
中國大陸手機號碼 | 1\d{10} |
中國大陸郵政編碼 | [1-9]\d{5} |
中國大陸身份證號(15位或18位) | \d{15}(\d\d[0-9xX])? |
非負整數(正整數或零) | \d+ |
正整數 | [0-9]*[1-9][0-9]* |
負整數 | -[0-9]*[1-9][0-9]* |
整數 | -?\d+ |
小數 | (-?\d+)(\.\d+)? |
不包含abc的單詞 | \b((?!abc)\w)+\b |
正則表達式:是指一個用來描述或者匹配一系列符合某個句法規則的字符串的單個字符串,簡單說,就是咱們寫個模板,而後去匹配字符串。數組
下面咱們來看看一些基本的正則表達式的語法:網絡
\:將下個字符標記爲一個特殊的字符、一個原義字符、一個向後引用或者一個八進制轉義符例如「\n」就是匹配一個換行符。
^:匹配開始位置,^(a)這個就匹配開頭必須爲a。
$:匹配結束位置,$(a)這個就匹配結尾必須爲a。
*:匹配前面的子表達式零次或者屢次,如「xu*」這個表達式就可以匹配「x」和「xuu」。
+:匹配前面的子表達式一次或者屢次,如「xu+」這個表達式就可以匹配「xuu」和「xu」,但不可以匹配「x」,這個就是和「*」的區別。
?:匹配前面的子表達式零次或者一次,如「xu?」這個表達式就可以匹配「jian(guo)?」就能夠匹配「jian」和「jianguo」。
{n}:n是一個非負數,匹配n次,如「guo{2}」,能夠匹配「guoo」,不能匹配「guo」。
{n,}:n是一個非負數,匹配至少n次。
{n, m}:m、n都是非負數,最少匹配n次,最多匹配m次。
(pattern):匹配pattern並獲取匹配結果。
(?:pattern):匹配pattern但不獲取匹配結果。
x|y:匹配x或y,如「(xu|jian)guo」匹配「xuguo」或者「jianguo」。
[xyz]:字符集合,匹配所包含的任意字符。如「[abc]」能夠匹配「apple」中的「a」。
[^xyz]:匹配未被包含的字符。
[a-z]:字符範圍,匹配指定範圍內的任意字符。
[^a-z]:匹配指定不在範圍內的任意字符。
\b:匹配一個單詞的邊界,如「guo\b」能夠匹配「xujianguo」中的「guo」。
\B:匹配非單詞邊界,如「jian\B」能夠匹配「xujianguo」中的「jian」。
\d:匹配一個數字字符,等價於「[0-9]」。
\D:匹配一個非數字字符。
\f:匹配一個換頁符。
\n:匹配一個換行符。
\r:匹配一個回車符。
\s:匹配任何空白字符
其實還有不少語法我就不一一列舉了,先說這麼多先
正則查找方法
– rangeOfString:options:
– rangeOfString:options:range:
– rangeOfString:options:range:locale:
正則替換方法
– stringByReplacingOccurrencesOfString:withString:options:range:
options參數指定搜索選項,類型爲NSStringCompareOptions,可經過位或操做指定爲NSCaseInsensitiveSearch, NSLiteralSearch, NSBackwardsSearch, NSAnchoredSearch>等選項的組合。
若指定的選項爲NSRegularExpressionSearch,則搜索字符串被認爲是ICU兼容的正則表達式,若是指定了此選項,則與其能夠同時存在的選項只有NSCaseInsensitiveSearch和NSAnchoredSearch
RegexKitLite向標準NSString類增長了不少方法來使用正則表達式,RegexKitLite使用iOS系統自帶的ICU(International Components for Unicode)正則引擎處理正則表達式,因此RegexKitLite使用的正則語法爲ICU的語法,使用RegexKitLite須要導入libicucore.dylib庫。
使用RegexKitLite的方法很簡單,將RegexKitLite.h和RegexKitLite.m加入到工程,而後引入libicucore.dylib庫便可。
RegexKitLite.h RegexKitLite.m
RegexKitLit NSString方法參考
RegexKitLite NSString Additions Reference
RegexKitLite的使用說明見:
Using RegexKitLite
ICU正則語法爲:
ICU Syntax
ICU User Guide – Regular Expressions
RegexKit Framework與RegexKitLite來自同一體系,但其更復雜和強大。RegexKit Framework不使用iOS系統的ICU正則庫,而是自帶 PCRE(Perl Compatible Regular Expressions)庫, 因此其正則語法是PCRE的語法。
RegexKit Framework功能很強大,其向NSArray,NSData,NSDictionary,NSSet和NSString對象增長了正則表達式的支持。
RegexKit.framework | RegexKitLite | |
---|---|---|
Regex Library | PCRE | ICU |
Library Included | Yes, built into framework object file. | No, provided by Mac OS X. |
Library Linked As | Statically linked into framework. | Dynamically linked to/usr/lib/libicucore.dylib. |
Compiled Size | Approximately 371KB† per architecture. | Very small, approximately 16KB—20KB‡ per architecture. |
Style | External, linked to framework. | Compiled directly in to final executable. |
Feature Set | Large, with additions to many classes. | Minimal, NSString only. |
經常使用的ICU正則匹配模式見:
RegexKitLite Cookbook
Description | Regex | Examples |
---|---|---|
Integer | [+\-]?[0-9]+ | 123-42+23 |
Hex Number | 0[xX][0-9a-fA-F]+ | 0×00xdeadbeef0xF3 |
Floating Point | [+\-]?(?:[0-9]*\.[0-9]+|[0-9]+\.) | 123..123+.42 |
Floating Point with Exponent | [+\-]?(?:[0-9]*\.[0-9]+|[0-9]+\.)(?:[eE][+\-]?[0-9]+)? | 123..12310.0E131.23e-7 |
Comma Separated Number | [0-9]{1,3}(?:,[0-9]{3})* | 421,2341,234,567 |
Comma Separated Number | [0-9]{1,3}(?:,[0-9]{3})*(?:\.[0-9]+)? | 421,2341,234,567.89 |
Description | Regex |
---|---|
Empty Line | (?m:^$) |
Empty or Whitespace Only Line | (?m-s:^\s*$) |
Strip Leading Whitespace | (?m-s:^\s*(.*?)$) |
Strip Trailing Whitespace | (?m-s:^(.*?)\s*$) |
Strip Leading and Trailing Whitespace | (?m-s:^\s*(.*?)\s*$) |
Quoted String, Can Span Multiple Lines, May Contain \" | "(?:[^"\\]*+|\\.)*" |
Quoted String, Single Line Only, May Contain \" | "(?:[^"\\\r\n]*+|\\[^\r\n])*" |
HTML Comment | (?s:<--.*?-->) |
Perl / Shell Comment | (?m-s:#.*$) |
C, C++, or ObjC Comment | (?m-s://.*$) |
C, C++, or ObjC Comment and Leading Whitespace | (?m-s:\s*//.*$) |
C, C++, or ObjC Comment | (?s:/\*.*?\*/) |
Description | Regex |
---|---|
HTTP | \bhttps?://[a-zA-Z0-9\-.]+(?:(?:/[a-zA-Z0-9\-._?,'+\&%$=~*!():@\\]*)+)? |
HTTP | \b(https?)://([a-zA-Z0-9\-.]+)((?:/[a-zA-Z0-9\-._?,'+\&%$=~*!():@\\]*)+)? |
HTTP | \b(https?)://(?:(\S+?)(?::(\S+?))?@)?([a-zA-Z0-9\-.]+)(?::(\d+))?((?:/[a-zA-Z0-9\-._?,'+\&%$=~*!():@\\]*)+)? |
\b([a-zA-Z0-9%_.+\-]+)@([a-zA-Z0-9.\-]+?\.[a-zA-Z]{2,6})\b | |
Hostname | \b(?:[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}?[a-zA-Z0-9]\.)+[a-zA-Z]{2,6}\b |
IP | \b(?:\d{1,3}\.){3}\d{1,3}\b |
IP with Optional Netmask | \b((?:\d{1,3}\.){3}\d{1,3})(?:/(\d{1,2}))?\b |
IP or Hostname | \b(?:(?:\d{1,3}\.){3}\d{1,3}|(?:[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}?[a-zA-Z0-9]\.)+[a-zA-Z]{2,6})\b |
在正則表達式中單獨使用*或+時,默認是匹配儘量多的數據,即貪婪匹配。
* Match zero or more times. Match as many times as possible. + Match one or more times. Match as many times as possible.
好比對 abcdefgabcdefg 使用abc(.*)g進行匹配,則捕獲到到的數據爲 defgabcdef。
若只想捕獲到第一個g,即只想獲得def,則須要使用最小匹配,在*或+後面加上?,即便用abc(.*?)g進行匹配。
*? Match zero or more times. Match as few times as possible. +? Match one or more times. Match as few times as possible.
另外,在正則中用(…)包含內容是要捕獲的數據,若是隻要用(…)來引用group而不想捕獲則可以使用(?:…)。
(…) Capturing parentheses. Range of input that matched the parenthesized subexpression is available after the match. (?:…) Non-capturing parentheses. Groups the included pattern, but does not provide capturing of matching text. Somewhat more efficient than capturing parentheses.
在書寫正則表達式時,須要將\進行轉義,即寫成兩個\\。
例如 匹配IP地址的正則表達式爲 \b(?:\d{1,3}\.){3}\d{1,3}\b,則在實際書寫時則爲
NSString *regex = @"\\b(?:\\d{1,3}\.){3}\\d{1,3}\\b";
參考:
iOS 開發中使用正則表達式-暨 RegexKitLite 庫的用法
RegexKitLite Documentation
[perl]理解貪婪匹配和最小匹配之間的區別
NSString Class Reference
ICU – International Components for Unicode
來源:http://blog.csdn.net/zeng11088/article/details/8766121
來源:http://www.cnblogs.com/xujh/archive/2008/08/21/1273525.html
<input onkeypress="return /[\w\u4e00-\u9fa5]/.test(String.fromCharCode(window.event.keyCode))"
onpaste="return !/[^\w\u4e00-\u9fa5]/g.test(window.clipboardData.getData('Text'))"
ondragenter="return false"/>
再粘貼一些別人寫的。
1.只能輸入數字和英文的:
<input onkeyup="value=value.replace(/[\W]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" ID="Text1" NAME="Text1">
2.只能輸入數字的:
<input onkeyup="value=value.replace(/[^\d]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" ID="Text2" NAME="Text2">
3.只能輸入全角的:
<input onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))" ID="Text3" NAME="Text3">
4.只能輸入漢字的:
<input onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))" ID="Text4" NAME="Text4">
5.郵件地址驗證:
var regu = "^(([0-9a-zA-Z]+)|([0-9a-zA-Z]+[_.0-9a-zA-Z-]*[0-9a-zA-Z]+))@([a-zA-Z0-9-]+[.])+([a-zA-Z]{2}|net|NET|com|COM|gov|GOV|mil|MIL|org|ORG|edu|EDU|int|INT)$"
var re = new RegExp(regu);
if (s.search(re) != -1) {
return true;
} else {
window.alert ("請輸入有效合法的E-mail地址 !")
return false;
}
6.身份證:
"^\\d{17}(\\d|x)$"
7.17種正則表達式
"^\\d+$" //非負整數(正整數 + 0)
"^[0-9]*[1-9][0-9]*$" //正整數
"^((-\\d+)|(0+))$" //非正整數(負整數 + 0)
"^-[0-9]*[1-9][0-9]*$" //負整數
"^-?\\d+$" //整數
"^\\d+(\\.\\d+)?$" //非負浮點數(正浮點數 + 0)
"^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮點數
"^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$" //非正浮點數(負浮點數 + 0)
"^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //負浮點數
"^(-?\\d+)(\\.\\d+)?$" //浮點數
"^[A-Za-z]+$" //由26個英文字母組成的字符串
"^[A-Z]+$" //由26個英文字母的大寫組成的字符串
"^[a-z]+$" //由26個英文字母的小寫組成的字符串
"^[A-Za-z0-9]+$" //由數字和26個英文字母組成的字符串
"^\\w+$" //由數字、26個英文字母或者下劃線組成的字符串
"^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+$" //email地址
"^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$" //url
=============================================
1.取消按鈕按下時的虛線框
在input裏添加屬性值 hideFocus 或者 HideFocus=true
2.只讀文本框內容
在input裏添加屬性值 readonly
3.防止退後清空的TEXT文檔(可把style內容作作爲類引用)
<INPUT style=behavior:url(#default#savehistory); type=text id=oPersistInput>
4.ENTER鍵可讓光標移到下一個輸入框
<input onkeydown="if(event.keyCode==13)event.keyCode=9" >
5.只能爲中文(有閃動)
<input onkeyup="value="/value.replace(/[" -~]/g,’’)" onkeydown="if(event.keyCode==13)event.keyCode=9">
6.只能爲數字(有閃動)
<input onkeyup="value="/value.replace(/["^\d] /g,’’) "onbeforepaste="clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^\d]/g,’’))">
7.只能爲數字(無閃動)
<input ime- mode:disabled" onkeydown="if(event.keyCode==13)event.keyCode=9" onKeyPress="if ((event.keyCode<48 || event.keyCode>57)) event.returnValue=false">
8.只能輸入英文和數字(有閃動)
<input onkeyup="value="/value.replace(/[\W] /g,"’’)" onbeforepaste="clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^\d]/g,’’))">
9.屏蔽輸入法
<input type="text" name="url" ime-mode:disabled" onkeydown="if(event.keyCode==13)event.keyCode=9">
10. 只能輸入 數字,小數點,減號(-) 字符(無閃動)
<input onKeyPress="if (event.keyCode!=46 && amp; event.keyCode!=45 && (event.keyCode<48 || event.keyCode>57)) event.returnValue=false">
11. 只能輸入兩位小數,三位小數(有閃動)
<input maxlength=9 onkeyup="if(value.match(/^\d{3}$/))value=" /value.replace(value,parseInt(value/10))" ;value="/value.replace(/\.\d*\./g,’."’)" onKeyPress="if((event.keyCode<48 || event.keyCode>57) && event.keyCode!=46 && event.keyCode!=45 || value.match(/^\d{3}$/) || /\.\d{3}$/.test(value)) {event.returnValue=false}" id=text_kfxe name=text_kfxe>
簡單的說,正則表達式是一種能夠用於模式匹配和替換的強有力的工具。其做用以下:
測試字符串的某個模式。例如,能夠對一個輸入字符串進行測試,看在該字符串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱爲數據有效性驗證。
替換文本。能夠在文檔中使用一個正則表達式來標識特定文字,而後能夠所有將其刪除,或者替換爲別的文字。
根據模式匹配從字符串中提取一個子字符串。能夠用來在文本或輸入字段中查找特定文字。
基本語法
在對正則表達式的功能和做用有了初步的瞭解以後,咱們就來具體看一下正則表達式的語法格式。
正則表達式的形式通常以下:
/love/ 其中位於「/」定界符之間的部分就是將要在目標對象中進行匹配的模式。用戶只要把但願查找匹配對象的模式內容放入「/」定界符之間 便可。爲了可以使用戶更加靈活的定製模式內容,正則表達式提供了專門的「元字符」。所謂元字符就是指那些在正則表達式中具備特殊意義的專用字符,能夠用來 規定其前導字符(即位於元字符前面的字符)在目標對象中的出現模式。
較爲經常使用的元字符包括: 「+」, 「*」,以及 「?」。
「+」元字符規定其前導字符必須在目標對象中連續出現一次或屢次。
「*」元字符規定其前導字符必須在目標對象中出現零次或連續屢次。
「?」元字符規定其前導對象必須在目標對象中連續出現零次或一次。
下面,就讓咱們來看一下正則表達式元字符的具體應用。
/fo+/ 由於上述正則表達式中包含「+」元字符,表示能夠與目標對象中的 「fool」, 「fo」, 或者 「football」等在字母f後面連續出現一個或多個字母o的字符串相匹配。
/eg*/ 由於上述正則表達式中包含「*」元字符,表示能夠與目標對象中的 「easy」, 「ego」, 或者 「egg」等在字母e後面連續出現零個或多個字母g的字符串相匹配。
/Wil?/ 由於上述正則表達式中包含「?」元字符,表示能夠與目標對象中的 「Win」, 或者「Wilson」,等在字母i後面連續出現零個或一個字母l的字符串相匹配。
有時候不知道要匹配多少字符。爲了能適應這種不肯定性,正則表達式支持限定符的概念。這些限定符能夠指定正則表達式的一個給定組件必需要出現多少次才能知足匹配。
{n} n 是一個非負整數。匹配肯定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',可是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配 n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的全部 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。
{n,m} m 和 n 均爲非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。
除了元字符以外,用戶還能夠精確指定模式在匹配對象中出現的頻率。例如,/jim {2,6}/ 上述正則表達式規定字符m能夠在匹配對象中連續出現2-6次,所以,上述正則表達式能夠同jimmy或jimmmmmy等字符串相匹配。
在對如何使用正則表達式有了初步瞭解以後,咱們來看一下其它幾個重要的元字符的使用方式。
使用實例
在JavaScript 1.2中帶有一個功能強大的RegExp()對象,能夠用來進行正則表達式的匹配操做。其中的test()方法能夠檢驗目標對象中是否包含匹配模式,並相應的返回true或false。
咱們可使用JavaScript編寫如下腳本,驗證用戶輸入的郵件地址的有效性。
正則表達式對象
本對象包含正則表達式模式以及代表如何應用模式的標誌。
Pattern
必選項。要使用的正則表達式模式。若是使用語法 1,用 "/" 字符分隔模式。若是用語法 2,用引號將模式引發來。
Flags
可選項。若是使用語法 2 要用引號將 flag 引發來。標誌能夠組合使用,可用的有:
示例
下面的示例建立一個包含正則表達式模式及相關標誌的對象(re),向您演示正則表達式對象的用法。在本例中,做爲結果的正則表達式對象又用於 match 方法中:
返回值: ain,ain,ain,ain\\
屬性 lastIndex 屬性 | source 屬性\\
方法 compile 方法 | exec 方法 | test 方法\\
要求 版本 3\\
請參閱 RegExp 對象 | 正則表達式語法 | String 對象\\
exec 方法
用正則表達式模式在字符串中運行查找,並返回包含該查找結果的一個數組。
rgExp.exec(str)
參數
rgExp
必選項。包含正則表達式模式和可用標誌的正則表達式對象。
str
必選項。要在其中執行查找的 String 對象或字符串文字。
說明\\
若是 exec 方法沒有找到匹配,則它返回 null。若是它找到匹配,則 exec 方法返回一個數組,而且更新全局 RegExp 對象的屬性,以反映匹配結果。數組的0元素包含了完整的匹配,而第1到n元素中包含的是匹配中出現的任意一個子匹配。這至關於沒有設置全局標誌 (g) 的 match 方法。
若是爲正則表達式設置了全局標誌,exec 從以 lastIndex 的值指示的位置開始查找。若是沒有設置全局標誌,exec 忽略 lastIndex 的值,從字符串的起始位置開始搜索。
exec 方法返回的數組有三個屬性,分別是 input、index 和 lastIndex。Input 屬性包含了整個被查找的字符串。Index 屬性中包含了整個被查找字符串中被匹配的子字符串的位置。LastIndex 屬性中包含了匹配中最後一個字符的下一個位置。
示例\\
下面的例子舉例說明了 exec 方法的用法:
返回值:0-3The 4-8rain 9-11in 12-17Spain 18-23falls 24-30mainly 31-33in 34-37the 38-43plain
test 方法\\
返回一個 Boolean 值,它指出在被查找的字符串中是否存在模式。
rgexp.test(str)
參數\\
rgexp
必選項。包含正則表達式模式或可用標誌的正則表達式對象。
str
必選項。要在其上測試查找的字符串。
說明
test 方法檢查在字符串中是否存在一個模式,若是存在則返回 true,不然就返回 false。
全局 RegExp 對象的屬性不禁 test 方法來修改。
示例
下面的例子舉例說明了 test 方法的用法:
函數調用:document.write (TestDemo(/ain+/ ,"The rain in Spain falls mainly in the plain."));
返回值:'The rain in Spain falls mainly in the plain.' contains 'ain+'
match 方法
使用正則表達式模式對字符串執行查找,並將包含查找的結果做爲數組返回。\\
stringObj.match(rgExp)
參數\\
stringObj
必選項。對其進行查找的 String 對象或字符串文字。
rgExp
必選項。爲包含正則表達式模式和可用標誌的正則表達式對象。也能夠是包含正則表達式模式和可用標誌的變量名或字符串文字。
說明\\
若是 match 方法沒有找到匹配,返回 null。若是找到匹配返回一個數組而且更新全局 RegExp 對象的屬性以反映匹配結果。
match 方法返回的數組有三個屬性:input、index 和 lastIndex。Input 屬性包含整個的被查找字符串。Index 屬性包含了在整個被查找字符串中匹配的子字符串的位置。LastIndex 屬性包含了最後一次匹配中最後一個字符的下一個位置。
若是沒有設置全局標誌 (g),數組的 0 元素包含整個匹配,而第 1 到 n 元素包含了匹配中曾出現過的任一個子匹配。這至關於沒有設置全局標誌的 exec 方法。若是設置了全局標誌,元素 0 到 n 中包含全部匹配。
示例\\
下面的示例演示了match 方法的用法:
本示例說明帶 g 標誌設置的 match 方法的用法。
上面幾行代碼演示了字符串文字的 match 方法的用法。
search 方法
返回與正則表達式查找內容匹配的第一個子字符串的位置。
stringObj.search(rgExp)
參數\\
stringObj
必選項。要在其上進行查找的 String 對象或字符串文字。
rgExp
必選項。包含正則表達式模式和可用標誌的正則表達式對象。
說明
search 方法指明是否存在相應的匹配。若是找到一個匹配,search 方法將返回一個整數值,指明這個匹配距離字符串開始的偏移位置。若是沒有找到匹配,則返回 -1。
示例\\
下面的示例演示了 search 方法的用法。
正則表達式語法
一個正則表達式就是由普通字符(例如字符 a 到 z)以及特殊字符(稱爲元字符)組成的文字模式。該模式描述在查找文字主體時待匹配的一個或多個字符串。正則表達式做爲一個模板,將某個字符模式與所搜索的字符串進行匹配。
這裏有一些可能會遇到的正則表達式示例:
下表是元字符及其在正則表達式上下文中的行爲的一個完整列表:
字符 描述
\ 將下一個字符標記爲一個特殊字符、或一個原義字符、或一個 後向引用、或一個八進制轉義符。例如,'n' 匹配字符 "n"。'\n' 匹配一個換行符。序列 '\\' 匹配 "\" 而 "\(" 則匹配 "("。
^ 匹配輸入字符串的開始位置。若是設置了 RegExp 對象的 Multiline 屬性,^ 也匹配 '\n' 或 '\r' 以後的位置。
$ 匹配輸入字符串的結束位置。若是設置了RegExp 對象的 Multiline 屬性,$ 也匹配 '\n' 或 '\r' 以前的位置。
* 匹配前面的子表達式零次或屢次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價於{0,}。
+ 匹配前面的子表達式一次或屢次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價於 {1,}。
? 匹配前面的子表達式零次或一次。例如,"do(es)?" 能夠匹配 "do" 或 "does" 中的"do" 。? 等價於 {0,1}。
{n} n 是一個非負整數。匹配肯定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',可是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的全部 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。
{n,m} m 和 n 均爲非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。
? 當該字符緊跟在任何一個其餘限制符 (*, +, ?, {n}, {n,}, {n,m}) 後面時,匹配模式是非貪婪的。非貪婪模式儘量少的匹配所搜索的字符串,而默認的貪婪模式則儘量多的匹配所搜索的字符串。例如,對於字符串 "oooo",'o+?' 將匹配單個 "o",而 'o+' 將匹配全部 'o'。
. 匹配除 "\n" 以外的任何單個字符。要匹配包括 '\n' 在內的任何字符,請使用象 '[.\n]' 的模式。
(pattern) 匹配pattern 並獲取這一匹配。所獲取的匹配能夠從產生的 Matches 集合獲得,在VBScript 中使用 SubMatches 集合,在JScript 中則使用 $0…$9 屬性。要匹配圓括號字符,請使用 '\(' 或 '\)'。
(?:pattern) 匹配 pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供之後使用。這在使用 "或" 字符 (|) 來組合一個模式的各個部分是頗有用。例如, 'industr(?:y|ies) 就是一個比 'industry|industries' 更簡略的表達式。
(?=pattern) 正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不須要獲取供之後使用。例如, 'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。預查不消耗字符,也就是說,在一個匹配發生後,在最後一次匹配以後當即開始下一次匹配的搜索,而不是從包含預查的字符以後開始。
(?!pattern) 負向預查,在任何不匹配Negative lookahead matches the search string at any point where a string not matching pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不須要獲取供之後使用。例如'Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows",但不能匹配 "Windows 2000" 中的 "Windows"。預查不消耗字符,也就是說,在一個匹配發生後,在最後一次匹配以後當即開始下一次匹配的搜索,而不是從包含預查的字符以後開始
x|y 匹配 x 或 y。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或 "food"。
[xyz] 字符集合。匹配所包含的任意一個字符。例如, '[abc]' 能夠匹配 "plain" 中的 'a'。
[^xyz] 負值字符集合。匹配未包含的任意字符。例如, '[^abc]' 能夠匹配 "plain" 中的'p'。
[a-z] 字符範圍。匹配指定範圍內的任意字符。例如,'[a-z]' 能夠匹配 'a' 到 'z' 範圍內的任意小寫字母字符。
[^a-z] 負值字符範圍。匹配任何不在指定範圍內的任意字符。例如,'[^a-z]' 能夠匹配任何不在 'a' 到 'z' 範圍內的任意字符。
\b 匹配一個單詞邊界,也就是指單詞和空格間的位置。例如, 'er\b' 能夠匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B 匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
\cx 匹配由x指明的控制字符。例如, \cM 匹配一個 Control-M 或回車符。 x 的值必須爲 A-Z 或 a-z 之一。不然,將 c 視爲一個原義的 'c' 字符。
\d 匹配一個數字字符。等價於 [0-9]。
\D 匹配一個非數字字符。等價於 [^0-9]。
\f 匹配一個換頁符。等價於 \x0c 和 \cL。
\n 匹配一個換行符。等價於 \x0a 和 \cJ。
\r 匹配一個回車符。等價於 \x0d 和 \cM。
\s 匹配任何空白字符,包括空格、製表符、換頁符等等。等價於 [ \f\n\r\t\v]。
\S 匹配任何非空白字符。等價於 [^ \f\n\r\t\v]。
\t 匹配一個製表符。等價於 \x09 和 \cI。
\v 匹配一個垂直製表符。等價於 \x0b 和 \cK。
\w 匹配包括下劃線的任何單詞字符。等價於'[A-Za-z0-9_]'。
\W 匹配任何非單詞字符。等價於 '[^A-Za-z0-9_]'。
\xn 匹配 n,其中 n 爲十六進制轉義值。十六進制轉義值必須爲肯定的兩個數字長。例如, '\x41' 匹配 "A"。'\x041' 則等價於 '\x04' & "1"。正則表達式中可使用 ASCII 編碼。.
\num 匹配 num,其中 num 是一個正整數。對所獲取的匹配的引用。例如,'(.)\1' 匹配兩個連續的相同字符。
\n 標識一個八進制轉義值或一個後向引用。若是 \n 以前至少 n 個獲取的子表達式,則 n 爲後向引用。不然,若是 n 爲八進制數字 (0-7),則 n 爲一個八進制轉義值。
\nm 標識一個八進制轉義值或一個後向引用。若是 \nm 以前至少有is preceded by at least nm 個獲取得子表達式,則 nm 爲後向引用。若是 \nm 以前至少有 n 個獲取,則 n 爲一個後跟文字 m 的後向引用。若是前面的條件都不知足,若 n 和 m 均爲八進制數字 (0-7),則 \nm 將匹配八進制轉義值 nm。
\nml 若是 n 爲八進制數字 (0-3),且 m 和 l 均爲八進制數字 (0-7),則匹配八進制轉義值 nml。
\un 匹配 n,其中 n 是一個用四個十六進制數字表示的 Unicode 字符。例如, \u00A9 匹配版權符號 (?)。
優先權順序
在構造正則表達式以後,就能夠象數學表達式同樣來求值,也就是說,能夠從左至右並按照一個優先權順序來求值。
下表從最高優先級到最低優先級列出各類正則表達式操做符的優先權順序:
普通字符
普通字符由全部那些未顯式指定爲元字符的打印和非打印字符組成。這包括全部的大寫和小寫字母字符,全部數字,全部標點符號以及一些符號。
最簡單的正則表達式是一個單獨的普通字符,能夠匹配所搜索字符串中的該字符自己。例如,單字符模式 'A' 能夠匹配所搜索字符串中任何位置出現的字母 'A'。這裏有一些單字符正則表達式模式的示例:
/a7M/
等價的 VBScript 表達式爲:
"a7M"
請注意這裏沒有鏈接操做符。所須要作的就是將一個字符放在了另外一個字符後面