正則表達式筆記(一)

概述

正則表達式是事先聲明一組規則,用於匹配字符串中的字符。正則表達式

基本語法

元字符

在正則表達式的模式中,有一些字符是有特殊含義的,被稱爲元字符。元字符都是針對單個字符匹配的。編碼

\w 匹配大小寫英文字符及數字 0 到 9 之間的任意一個及下劃線,至關於 [a-zA-Z0-9_]code

\W 不匹配大小寫英文字符及數字 0 到 9 之間的任意一個,至關於 [^a-zA-Z0-9_]模板引擎

\s 匹配任何空白字符,至關於 [ \f\n\r\t\v]字符串

\S 匹配任何非空白字符,至關於 [^\s]模板

\d 匹配任何 0 到 9 之間的單個數字,至關於 [0-9]表單

\D 不匹配任何 0 到 9 之間的單個數字,至關於 [^0-9]表單驗證

[\u4e00-\u9fa5] 匹配任意單個漢字(這裏用的是 Unicode 編碼表示漢字的 )語法

界定符

比較通用的正則表達式界定符是雙斜槓 /regex/英文

原子的概念

正則表達式中的原子分爲可見原子和不可見原子。

[ \f\n\r\t\v] 屬於不可見原子,其餘表示可見原子

量詞

\* 匹配 0 到多個元字符,至關於 {0,}

? 匹配 0 到 1 個元字符,至關於 {0,1}

{n} 匹配 n 個元字符

{n,} 匹配至少 n 個元字符

{n,m} 匹配 n 到 m 個元字符

\+ 匹配至少 1 個元字符,至關於 {1,}

邊界

\b 匹配單詞邊界

^ 字符串必須以指定的字符開始

$ 字符串必須以指定的字符結束

捕獲分組

正則表達式中,使用 () 將若干單位(能夠是字符,正則表達式)組織在一塊兒,成爲一個獨立單元。

正則表達式中,分組分爲捕獲分組和非捕獲分組。

/(pattern)/flags

模式修正

貪婪/懶惰,忽略大小寫,忽略空白字符

使用場景

表單驗證, 模板引擎

相關文章
相關標籤/搜索