正則表達式

  • 正則表達式,又稱規則表達式,英文名爲Regular Expression,在代碼中常簡寫爲regex、regexp或RE。 
  • 正則表一般被用來檢索、替換那些符合某個模式(規則)的文本。
  • 正則表達式是一種文本模式,模式描述在搜索文本時要匹配的一個或多個字符串。

 

正則表達式的做用:

1. 給定的字符串是否符合正則表達式的過濾邏輯(稱做「匹配」);
2. 能夠經過正則表達式,從字符串中獲取咱們想要的特定部分。

正則表達式的特色:

1. 靈活性、邏輯性和功能性很是強;
2. 能夠迅速地用極簡單的方式達到字符串的複雜控制。

元字符

 

應用舉例:

  1.  在test.txt文件中的每一行中搜索正則表達式r.t,並打印輸出匹配的行。正則表達式r.t匹配r開頭接着任何一個字符再接着字符t。正則表達式是大小寫敏感的。要想同時匹配大寫和小寫字母,應該使用字符區間元字符(方括號)。正則表達式[Rr]可以同時匹配R和r。因此,要想匹配一個大寫或者小寫的r接着任何一個字符再接着一個t就要使用這個表達式:[Rr].t。
  2. 抑揚字符(^),有時也被叫作插入符。例如,想找到text.txt中行首"he"打頭的行,若是用簡單表達式he,會匹配the,因此要使用正則表達式^he,它只匹配在行首出現的he。有時候指定「除了×××都匹配」,當抑揚字符(^)出方括號中時,它表示「排除」,例如要匹配he ,可是排除前面是t or s的情形(也就是the和she),能夠使用:[^st]he。
  3. 要指定特定數量的匹配,要使用大括號(注意必須使用反斜槓「\」來轉義)。想匹配全部10和100的實例而排除1和 1000,能夠使用:10\{1,2\},這個正則表達式匹配數字1後面跟着1或者2個0的模式。在這個元字符的使用中一個有用的變化是忽略第二個數字,例如正則表達式0\{3,\} 將匹配至少3個連續的0。

   不一樣的語言(如PHP和JAVA)、相同語言的不一樣類庫(如來自Sun的Java Regular Expression類庫跟Apache Jakarta的正則表達式類庫)間,用法會有所差異,在使用的時候,要注意這些差異。正則表達式

相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息