本文章主要講如何使用正則匹配中文字符,中文正則表達式的匹配規則不像其餘正則規則同樣容易記住,下面一塊兒看看這個中文正則表達式是怎麼樣的。html
\w匹配的僅僅是中文,數字,字母,對於國人來說,僅匹配中文時常會用到,見下前端
1 匹配中文字符的正則表達式: [\u4e00-\u9fa5]
或許你也須要匹配雙字節字符,中文也是雙字節的字符正則表達式
匹配雙字節字符(包括漢字在內):[^\x00-\xff]
注:能夠用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)post
更多經常使用正則表達式匹配規則:spa
英文字母:[a-zA-Z]
數字:[0-9]
匹配中文,英文字母和數字及_:code
^[\u4e00-\u9fa5_a-zA-Z0-9]+$
同時判斷輸入長度:·regexp
[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}
^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$
一、一個正則表達式,只含有漢字、數字、字母、下劃線不能如下劃線開頭和結尾:htm
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$
其中:blog
^ 與字符串開始的地方匹配開發
(?!_) 不能以_開頭 (?!.*?_$) 不能以_結尾 [a-zA-Z0-9_\u4e00-\u9fa5]+ 至少一個漢字、數字、字母、下劃線
$ 與字符串結束的地方匹配
放在程序裏前面加@,不然須要\\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$" (或者:@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )
二、只含有漢字、數字、字母、下劃線,下劃線位置不限:
^[a-zA-Z0-9_\u4e00-\u9fa5]+$
三、由數字、26個英文字母或者下劃線組成的字符串
^\w+$
四、2~4個漢字
@"^[\u4E00-\u9FA5]{2,4}$";
五、
//code from http://caibaojian.com/zhongwen-regexp.html ^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
用:(Abc)+ 來分析: XYZAbcAbcAbcXYZAbcAb
來源:前端開發博客