如何使用正則匹配中文字符

時間 2019-12-12

原文原文鏈接

本文章主要講如何使用正則匹配中文字符，中文正則表達式的匹配規則不像其餘正則規則同樣容易記住，下面一塊兒看看這個中文正則表達式是怎麼樣的。html

\w匹配的僅僅是中文，數字，字母，對於國人來說，僅匹配中文時常會用到，見下前端

1 匹配中文字符的正則表達式： [\u4e00-\u9fa5]

或許你也須要匹配雙字節字符，中文也是雙字節的字符正則表達式

匹配雙字節字符(包括漢字在內)：[^\x00-\xff]

注：能夠用來計算字符串的長度（一個雙字節字符長度計2，ASCII字符計1）post

更多經常使用正則表達式匹配規則：spa

英文字母:[a-zA-Z]

數字:[0-9]

匹配中文，英文字母和數字及_:code

^[\u4e00-\u9fa5_a-zA-Z0-9]+$

同時判斷輸入長度：·regexp

[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}

^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$

一、一個正則表達式，只含有漢字、數字、字母、下劃線不能如下劃線開頭和結尾：htm

^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$

其中：blog

^ 與字符串開始的地方匹配開發

(?!_)　　不能以_開頭

(?!.*?_$)　　不能以_結尾

[a-zA-Z0-9_\u4e00-\u9fa5]+　　至少一個漢字、數字、字母、下劃線

$　　與字符串結束的地方匹配

放在程序裏前面加@，不然須要\\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"

（或者：@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )

二、只含有漢字、數字、字母、下劃線，下劃線位置不限：

^[a-zA-Z0-9_\u4e00-\u9fa5]+$

三、由數字、26個英文字母或者下劃線組成的字符串

^\w+$

四、2~4個漢字

@"^[\u4E00-\u9FA5]{2,4}$";

五、

//code from http://caibaojian.com/zhongwen-regexp.html
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$

用：(Abc)+ 來分析： XYZAbcAbcAbcXYZAbcAb

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。