\w匹配的僅僅是中文,數字,字母,對於國人來說,僅匹配中文時常會用到,見下html
匹配中文字符的正則表達式: [\u4e00-\u9fa5]
或許你也須要匹配雙字節字符,中文也是雙字節的字符正則表達式
匹配雙字節字符(包括漢字在內):[^\x00-\xff]
注:能夠用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)code