正則表達式

本連接轉載自:http://www.javashuo.com/article/p-qnlqodjk-cs.html

僅供自學使用。php

 

第1章 什麼是正則表達式

  1. 正則表達式就是爲了處理大量的文本|字符串而定義的一套規則和方法
  2. 經過定義的這些特殊符號的輔助,系統管理員就能夠快速過濾,替換或輸出須要的字符串。Linux正則表達式通常以行爲單位處理。

簡單說html

  • 爲處理大量文本|字符串而定義的一套規則和方法
  • 以行爲單位出來,一次處理一行

正則表達式是一種描述一組字符串的模式,相似數字表達式,經過各類操做符組成更小的表達式linux

第2章 爲什麼使用正則表達式

linux運維工做,大量過濾日誌工做,化繁爲簡。
簡單,高效。
正則表達式高級工具;三劍客都支持git

第3章 容易混淆的兩個注意事項

  • 正則表達式應用很是普遍,存在於各類語言中,php perl grep sed awk 支持。ls * 通配符
  • 但如今學的是Linux中的正則表達式,最常應用正則表達式的命令是grep(egrep),sed,awk。
  • 正則表達式和通配符有本質區別

正則表達式用來找:【文件】內容,文本,字符串。通常只有三劍客支持
通配符用來找:文件名,普通命令都支持正則表達式

第4章 正則表達式使用注意事項

  1. linux正則表達式以行爲單位處理字符串express

  2. 便於區別過濾出來的字符串,必定配合grep/egrep命令學習。運維

QQ20170113-120100@2x.png-44.5kB

  1. 注意字符集,exportLC_All=C:不管什麼時候,作何事都要注意字符集
    QQ20170113-120538@2x.png-60.2kB

第5章 正則表達式的分類

POSIX規範將正則表達式的分爲了兩種工具

  • 基本正則表達式(BRE,basic regular expression)
  • 高級功能:擴展正則表達式(ERE,extended regular expression)

5.1 BRE和ERE的區別僅僅是元字符的不一樣:

  • BRE(基礎正則表達式)只認可的元字符有^$.[]*其餘字符識別爲普通字符:\(\)
  • ERE(擴展正則表達式)則添加了(){}?+|等
  • 只有在用反斜槓「」進行轉義的狀況下,字符(){}纔會在BRE被看成元字符處理,而ERE中,任何元符號前面加上反斜槓反而會使其被看成普通字符來處理。

第6章 如何區分通配符和正則表達式

  1. 不須要思考的判斷方法:在三劍客awk,sed,grep,egrep都是正則,其餘都是通配符
  2. 區別通配符和正則表達式最簡單的方法:

(1)文件目錄名===>通配符
(2)文件內容(字符串,文本【文件】內容)===>正則表達式linux運維

  1. 通配符和正則表達式都有「*」,「?」,「【】」,可是通配符的這些符號都能自身表明任意字符,而正則表達式的這些符號只能表明這些符號前面的字符

第7章 基本正則表達式

7.1 基礎正則表達式

字符 描述
^ ^word搜索以word開頭的內容

QQ20170113-132202@2x.png-30.8kB

$ word$搜索以word結尾的內容

QQ20170113-132502@2x.png-36.3kB

^$ 表示空行,不是空格

QQ20170113-192441@2x.png-133.1kB

. 表明且只能表明任意一個字符(不匹配空行)

QQ20170113-192802@2x.png-19.3kB

\ 轉義字符,讓有特殊含義的字符脫掉馬甲,現出原形,如\.只表示小數點

QQ20170113-193830@2x.png-29.5kB

* 重複以前的字符或文本0個或多個,以前的文本或字符連續0次或屢次

QQ20170113-200334@2x.png-86.6kB

.* 任意多個字符

QQ20170113-195151@2x.png-83.1kB

^.* 以任意多個字符串開頭,.*儘量多,有多少算多少,貪婪性

QQ20170114-093126@2x.png-45.7kB

括號表達式  
[abc][0-9][\.,/] 匹配字符集合內的任意一個字符a或b或c:[a-z]匹配全部小寫字母;表示一個總體,內藏無限可能;[abc]找a或b或c能夠寫成[a-c]

QQ20170114-100040@2x.png-82.2kB

[^abc] 匹配不包含^後的任意字符a或b或c,是對[abc]的取反,且與^含義不一樣

QQ20170114-100916@2x.png-37.3kB

a\{n,m\} 重複前面a字符n到m次(若是用egrep或sed -r可去掉斜線)

QQ20170114-102002@2x.png-67.9kB

a\{n,\} 重複前面a字符至少n次,若是用egrep或sed -r可去掉斜線
a\{n\} 重複前面a字符n次,若是用egrep或sed -r可去掉斜線
--- ---

第8章 擴展正則表達式ERE

特殊字符 含義與例子
+ 重複前一個字符一次或一次以上,前一個字符連續一個或多個,把連續的文本/字符取出

QQ20170114-104142@2x.png-97.8kB

重複前面一個字符0次或1次(.是有且只有1個)

QQ20170114-104617@2x.png-55.8kB

管道符 表示或者同時過濾多個字符

屏幕快照 2017-01-14 上午10.57.12.png-92.5kB

() 分組過濾被括起來的東西表示一個總體(一個字符),後向引用

QQ20170114-111147@2x.png-72.7kB

第9章 正則小結

  • 基礎正則:BRE
    |^|$|.||.|[abc]|[^abc]|
    |---|---|學習

  • 擴展正則:ERE
    |+|||?|()|{}|a{n,m}|a{n,}|a{n}|
    |---|---|

  • 轉義字符\:將字符的意思改變(不支持正則符號的,轉變字符含義爲正則,支持正則的轉變爲普通字符含義)

注意:

  • grep默認不支持正則,所以正則表達式的符號對於grep來講就等同於普通字符含義,所以,想讓grep直接處理正則符號必須經過轉義字符\{\}來處理。
  • grep -E 強制讓grep直接認識正則符號,不須要再進行轉義
  • egrep 等效grep -E 天生就能認識正則符號
  • 咱們平時備份能夠經過cp 文件名{,.bak}的形式進行,避免再打一次文件名
    sed -r :讓sed支持正則

第10章 基本正則和擴展正則區別

基礎正則BRE 擴展正則ERE
\? ?
\+ +
\{\} {}
\( \ ) ()
\  

所謂基礎正則實際上就是得須要轉義字符配合表達的正則,而擴展正則就是讓命令擴展它的權限讓他直接就認識正則表達符號(egrep,sed -r,awk直接支持)

第11章 補充說明

11.1 一些預約義的:

正則表達式 描述 示例
[:alnum:] [a-zA-Z0-9]匹配任意一個字母或數字字符 [[:alnum:]]+
[:alpha:] 匹配任意一個字母字符(包括大小寫字母) [[:alpha:]]{4}
[:blank:] 空格與製表符(橫向縱向) [[:blank:]]*
[:digit:] 匹配任意一個數字字符 [[:digit:]]?
[:lower:] 匹配小寫字母 [[:lower:]]{5,}
[:upper:] 匹配大寫字母 ([[:upper:]]+)?
[:punct:] 匹配標點符號 [[:punct:]]
[:space:] 匹配一個包括換行符,回車等在內的全部空白符 [[:space:]]+
[:graph:] 匹配任何一個能夠看得見的且能夠打印的字符 [[:graph:]]
[:xdigit:] 任何一個十六進制數 [[:xdigit:]]+
[:cntrl:] 任何一個控制字符(ASCII字符集中的前32個字符) [[:cntrl:]]
[:print:] 任何一個能夠打印的字符 [[:print:]]

11.2 元字符

元字符是一種Perl風格的正則表達式,只有一部分文本處理工具支持它,並非全部的文本處理工具都支持

正則表達式 描述 示例
\b 單詞邊界 \bcool\b匹配cool,不匹配coolant
\B 非單詞邊界 cool\B匹配coolant不匹配cool
\d 單個數字字符 b\db匹配b2b,不匹配bcb
\D 單個非數字字符 b\Db匹配bcb不匹配b2b
\w 單個單詞字符(字母,數字與_) \w匹配1或a,不匹配&
\W 單個非單詞字符 \W匹配&,不匹配1或a
\n 換行符 \n匹配一個新行
\s 單個空白字符 x\sx匹配xx,不匹配xx
\S 單個非空白字符 x\S\x匹配xkx,不匹配xx
\r 回車 \r匹配回車
\t 橫向製表符 \t匹配一個橫向製表符
\v 垂直製表符 \v匹配一個垂直製表符
\f 換頁符 \f匹配一個換頁符

第12章 正則表達式總結

  • egrep/grep 瞭解一下正則,簡單看看效果,結果
  • egrep/grep -o 參數看正則到底匹配了什麼
  • 多練就好,配合grep,egrep,sed -r,awk更爲強大

第13章 參考資料

點我查看:正則表達式30分鐘入門教程

相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息