C# 正則進階

.NET 中的正則表達式是基於 Perl 5 的正則表達式。正則表達式

超時

從 .NET Framework 4.5 開始,正則表達式支持在匹配操做中指定超時時間。若是匹配超時,就會拋出 RegexMatchTimeoutExceptionlua

全部方法都增長了帶超時時間參數的重載:code

public static Match Match(string input, string pattern, RegexOptions options, TimeSpan matchTimeout);

public static MatchCollection Matches(string input, string pattern, RegexOptions options, TimeSpan matchTimeout);

public static string Replace(string input, string pattern, string replacement, RegexOptions options, TimeSpan matchTimeout);

public static string[] Split(string input, string pattern, RegexOptions options, TimeSpan matchTimeout);

若是應用程序須要處理任意的正則表達式(例如在高級搜索對話框中)則務必使用該參數以防止一些惡意的正則表達式致使無限計算。索引

編譯正則表達式

RegexOptions.Compiled 選項將會使 Regex 實例經過輕量級的代碼生成器動態地構建並編譯針對特定正則表達式的代碼,提升匹配速度。字符串

模式修正符

模式修正符不只能夠打開,還能夠關閉。以下示例,先打開忽略大小寫,再關閉忽略大小寫,因此匹配結果是 Aainput

Regex.Match("AAAa", "(?i)a(?-i)a").Value;    // Aa

零寬斷言

如今要寫一個用於驗證密碼是否符合要求的正則表達式,要求是至少包含一個數字。string

這個很簡單,以下就能夠了it

Regex.IsMatch("12345678", "\d");

如今加一個條件,長度要大於 6 位。彷佛用一個正則沒法實現。io

實際上是能夠的,用零寬斷言中的 正向先行斷言 就能夠了。編譯

正向先行斷言 (?=exp),通常用來匹配 exp 以前的內容。例以下面個例子,要取出姓名,須要匹配 以前的內容。

Regex.Match("姓名張三,男,30 歲", "(?<=姓名).*?(?=,)").Value;  // 張三

其實,正確的理解是:正向先行斷言,匹配成功以後,會退回起始位置,而後繼續以後的匹配。

這裏最重要的一點是,匹配成功之後退回起始位置,因此,對它正確的理解是,一個前向條件判斷。

那麼上面的密碼至少包含一個數字,且長度大於 6 就好實現了:

Regex.IsMatch("abcde6", @"(?=.*\d).{6,}");

咱們再增長一點難度,密碼要求符合以下條件:

  • 至少 8 位
  • 至少包含一個數字
  • 至少包含一個小寫字母
  • 至少包含一個大寫字母
string pattern = @"(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,}";
Regex.IsMatch("12345678", pattern);  // false
Regex.IsMatch("1234567a", pattern);  // false
Regex.IsMatch("123456aA", pattern);  // true

分割字符串

分割字符串分隔符不會包含在結果中,若要將分隔符包含在結果中,則能夠將表達式包含在正前向條件中。

foreach (string s in Regex.Split("oneTwoThree", "(?=[A-Z])"))
    Console.WriteLine(s);
    
// one
// Two
// Three

分組

正則表達式中能夠經過 \n 語法來引用索引爲 n 的分組。

var m = Regex.Matches("pop pope peep", @"\b(\w)\w+\1\b");

// pop
// peep

命名捕獲分組語法:
(?'組名'表達式)(?<組名>表達式)

引用命名分組語法:
\k'組名'\k<組名>

替換並分割文本

替換字符串能夠經過 $0 做爲替代結構訪問原始的匹配。$1$2 訪問任意捕獲的分組。對於命名分組,能夠經過 ${name} 的方式進行訪問。

給全部數字加上 <>:

Console.WriteLine(Regex.Replace("1 + 11 = 12", @"\d+", @"<$0>"));
// <1> + <11> = <12>

MatchEvaluator 委託

Replace 方法有一個重載,使用 MatchEvaluator 委託做爲參數,替代 replacement。該委託將對每一個匹配執行一次,並使用其返回結果替換原字符串中的值。

MatchEvaluator 委託定義:

public delegate string MatchEvaluator(Match match);

示例:

Console.WriteLine(Regex.Replace("1 + 11 = 12", @"\d+", m => (int.Parse(m.Value) * 10).ToString()));

// 10 + 110 = 120
相關文章
相關標籤/搜索