http://www.cnblogs.com/penseur/archive/2011/02/25/1964522.htmlhtml
毋庸多言,在vim中正則表達式獲得了十分普遍的應用。 最經常使用的 / 和 :s 命令中,正則表達式都是不可或缺的。 下面對vim中的正則表達式的一些難點進行說明。正則表達式
關於magicvim
vim中有個magic的設定。設定方法爲:c#
:set magic " 設置magic :set nomagic " 取消magic :h magic " 查看幫助編輯器
vim畢竟是個編輯器,正則表達式中包含的大量元字符若是原封不動地引用(像perl 那樣), 勢必會給不懂正則表達式的人形成麻煩,好比 /foo(1) 命令, 大多數人都用它來查找foo(1)這個字符串, 但若是按照正則表達式來解釋,被查找的對象就成了 foo1 了。函數
因而,vim就規定,正則表達式的元字符必須用反斜槓進行轉義才行, 如上面的例子,若是確實要用正則表達式,就應當寫成 /foo\(1\) 。 可是,像 . * 這種極其經常使用的元字符,都加上反斜槓就太麻煩了。 並且,衆口難調,有些人喜歡用正則表達式,有些人不喜歡用……學習
爲了解決這個問題,vim設置了 magic 這個東西。簡單地說, magic就是設置哪些元字符要加反斜槓哪些不用加的。 簡單來講:atom
magic (\m):除了 $ . * ^ 以外其餘元字符都要加反斜槓。spa
nomagic (\M):除了 $ ^ 以外其餘元字符都要加反斜槓。.net
這個設置也能夠在正則表達式中經過 \m \M 開關臨時切換。 \m 後面的正則表達式會按照 magic 處理,\M 後面的正則表達式按照 nomagic 處理, 而忽略實際的magic設置。
例如:
/\m.* # 查找任意字符串
/\M.* # 查找字符串 ".*"
另外還有更強大的 \v 和 \V。
\v (即 very magic 之意):任何元字符都不用加反斜槓
\V (即 very nomagic 之意):任何元字符都必須加反斜槓
例如:
/\v(a.c){3}$ # 查找行尾的abcaccadc
/\m(a.c){3}$ # 查找行尾的(abc){3}
/\M(a.c){3}$ # 查找行尾的(a.c){3}
/\V(a.c){3}$ # 查找任意位置的(a.c){3}$
正則表達式的()和[]的用法: http://blog.csdn.net/hanjieson/article/details/8885206 http://www.cnblogs.com/snandy/p/3650309.html 1.(A\d){2}----> (ABC)?---->0個或者1個ABC-----> (ABC)+---->1個以上ABC--------> (ABC)*----->0個或者多個ABC---------> -------------------------------------------------- 2.(ABC|123)----> ************************************** 2.1gr(a|e)y---->匹配gray或者grey --->等價於gr[ae]y 2.2(Doctor|Dr\.?)--->匹配Doctor Dr Dr.----->?表示0個或者1個; ps (Doctor|Dr.?)這個也能夠匹配Doctor Dr Dr. 不一樣明白\在這裏的意義.. ------------------------------------------------------------------------ 3.錯誤匹配的交替行爲:使用交替行爲時,有時會出現意想不到的錯誤 用(a|ab)匹配ab時,只能匹配a 用(ab|a)則能夠匹配ab-------------> -------------------------------------------------------------------------- 4.捕獲圓括號:正則表達式中,與位於圓括號之間的模式匹配的內容都會被捕獲 **************************************************** 4.1當模式中有嵌套的圓括號時,變量的編號會按照圓開括號出現的位置一次進行 ([A-Za-z](\d{2}))((-)\d{2})----->匹配A22-33時匹配狀況以下: group1:A22 group2:22 group3:-33 group4:- ------------------------------------------------------------------------- 5..NET和JavaScript中,表示匹配第一組的變量被指定爲」\1」 ps +表示"一個以上" ?表示"0個或者1個" *表示"o個或者多個"
(boy)\1------> ps:(boy)是一個"boy" \1是一個"boy" 因此只能匹配boyboy
(boy)(girl)\1\2-----> ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ http://www.cnblogs.com/snandy/p/3662423.html 接下來是[]的學習 (以c#的語法進行說明--->其餘語法雖然不一樣可是正則的規則是相同的) 1.簡單字符組 ---------------------------------------------------------------------------------- 2.範圍字符組(Range class,與連字符 「-」 一塊兒使用) 若是要匹配0-9能夠寫成 [0123456789],但有了範圍字符組更簡潔了,能夠寫成 /[0-9]/ 匹配小寫英文字母能夠用字符組 [a-z], 匹配大寫英文字母用 [A-Z]。 這裏最關鍵的是連字符 "-",不要理解爲減號。 它的意義是「從什麼到什麼」,如[a-z]理解爲從 「a」 到 「z」。 須要注意幾點 1. 連字符(-)只在字符組內(中括號)纔是元字符。如 2. 甚至在字符組內部,它也不必定是元字符。如 此外,不少元字符在字符組內都變成了普通字符,如(^$?)等。 3. 範圍不能亂寫,好比只能 [0-9],不能[9-0]. 範圍字符組實際是安裝字符對於的ASCII碼值來肯定的,值小的在前面,值大的在後面。例如[0-9]的碼值爲48~57,[a-z]的碼值爲97~122,[A-Z]的碼值爲65~90。 4.組合字符組 ->由多種字符組組合一塊兒的字符組->須要注意的是,字符組內不要有空格,有人喜歡在f和1之間加個空格,以便閱讀起來舒服一些,但這是不容許的 ------------------------------------------------------------------------------------------------------------------------------------------ 3.排除型字符組(Negated character class,與脫字符 「^」 一塊兒使用)--->即不匹配xxx ------------------------------------------------------------------------------------------------------------ 4.字符組運算(方括號嵌套+運算符) 有些語言支持,好比&&+[] Java中就支持,但JavaScript不支持 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ http://www.jb51.net/article/52594.htm \s--->空格 \s{3}---->匹配3個空格 \s[1,3]---->匹配 1個空格 or 2個空格 or 3個空格 (0-9)---->匹配'0-9' [0-9]{1,3} VS [0-9]{1,4} VS [0-9]{1,2} 這個到底怎麼用啊....沒看明白語法 (a){1,3} VS (a){1,4} VS (a){1,2} 這個到底怎麼用啊....沒看明白語法
1{n}重複n次 1{m,n}最小重複m次,最多重複n次----------------------------> 1{m,} 最小重複m次---------------------------->-->字符串0-9重複數字10次因此\d{9,}是能夠把這個字符串匹配出來的.
感謝各位帖子的博主. |
默認設置是 magic,vim也推薦你們都使用magic的設置,在有特殊須要時,直接經過 \v\m\M\V 便可。
本文下面使用的元字符都是 magic 模式下的。
量詞
vim的量詞與perl相比一點也不遜色。 vim的量詞和perl的量詞的對照表
vim | Perl | 意義 |
* | * | 0個或多個(匹配優先) |
\+ | + | 1個或多個(匹配優先) |
\? 或 \= | ? | 0個或1個(匹配優先),\?不能在 ? 命令(逆向查找)中使用 |
\{n,m} | {n,m} | n個到m個(匹配優先) |
\{n,} | {n,} | 最少n個(匹配優先) |
\{,m} | {,m} | 最多m個(匹配優先) |
\{n} | {n} | 剛好n個 |
\{-n,m} | {n,m}? | n個到m個(忽略優先) |
\{-} | *? | 0個或多個(忽略優先) |
\{-1,} | +? | 1個或多個(忽略優先) |
\{-,1} | ?? | 0個或1個(忽略優先) |
環視和固化分組
vim竟然還支持環視和固化分組的功能,強大,贊一個 關於環視的解釋請參考Yurii的《精通正則表達式》 一書吧。
vim | Perl | 意義 |
\@= | (?= | 順序環視 |
\@! | (?! | 順序否認環視 |
\@<= | (?<= | 逆序環視 |
\@<! | (?<! | 逆序否認環視 |
\@> | (?> | 固化分組 |
\%(atom\) | (?: | 非捕獲型括號 |
和perl稍有不一樣的是,vim中的環視和固化分組的模式的位置與perl不一樣。 例如,查找緊跟在 foo 以後的 bar,perl將模式寫在環視的括號內, 而vim將模式寫在環視的元字符以前。
# Perl的寫法 /(?<=foo)bar/
# vim的寫法 /\(foo\)\@<=barvim正則表達式 寫道
元字符 說明
. 匹配任意一個字符
[abc] 匹配方括號中的任意一個字符。可使用-表示字符範圍,如[a-z0-9]匹配小寫字母和阿拉伯數字。[^abc] 在方括號內開頭使用^符號,表示匹配除方括號中字符以外的任意字符。
\d 匹配阿拉伯數字,等同於[0-9]。
\D 匹配阿拉伯數字以外的任意字符,等同於[^0-9]。
\x 匹配十六進制數字,等同於[0-9A-Fa-f]。
\X 匹配十六進制數字,等同於[^0-9A-Fa-f]。
\w 匹配單詞字母,等同於[0-9A-Za-z_]。
\W 匹配單詞字母以外的任意字符,等同於[^0-9A-Za-z_]。
\t 匹配<TAB>字符。
\s 匹配空白字符,等同於[ \t]。
\S 匹配非空白字符,等同於[^ \t]。
\a 全部的字母字符. 等同於[a-zA-Z]
\l 小寫字母 [a-z]
\L 非小寫字母 [^a-z]
\u 大寫字母 [A-Z]
\U 非大寫字母 [^A-Z]
表示數量的元字符
元字符 說明
* 匹配0-任意個
\+ 匹配1-任意個 注意 前面的\
\? 匹配0-1個 注意 前面的\
\{n,m} 匹配n-m個 注意 前面的\
\{n} 匹配n個 注意 前面的\
\{n,} 匹配n-任意個 注意 前面的\
\{,m} 匹配0-m個 注意 前面的\
\_. 匹配包含換行在內的全部字符
\{-} 表示前一個字符可出現零次或屢次,但在整個正則表達式能夠匹配成功的前提下,匹配的字符數越少越好
\= 匹配一個無關緊要的項
\_s 匹配空格或斷行
\_[]
元字符 說明
\* 匹配 * 字符。
\. 匹配 . 字符。
\/ 匹配 / 字符。
\\ 匹配 \ 字符。
\[ 匹配 [ 字符。
表示位置的符號
元字符 說明
$ 匹配行尾
^ 匹配行首
\< 匹配單詞詞首
\> 匹配單詞詞尾
替換變量
在正規表達式中使用 \( 和 \) 符號括起正規表達式,便可在後面使用\一、\2等變量來訪問 \( 和 \) 中的內容。
懶惰模式
\{-n,m} 與\{n,m}同樣,儘量少次數地重複
\{-} 匹配它前面的項一次或0次, 儘量地少
\| "或"操做符
\& 並列
函數式
:s/替換字符串/\=函數式
在函數式中可使用 submatch(1)、submatch(2) 等來引用 \一、\2 等的內容,而submatch(0)能夠引用匹配的整個內容。
與Perl正則表達式的區別 ?
元字符的區別
Vim語法 Perl語法 含義
\+ + 1-任意個
\? ? 0-1個
\{n,m} {n,m} n-m個
\(和\) (和) 分組
例如:
1, 去掉全部的行尾空格:「:%s/\s\+$//」。「%」表示在整個文件範圍內進行替換,「\s」表示空白字符(空格和製表符),「\+」對前面的字符匹 配一次或屢次(越多越好),「___FCKpd___0rdquo;匹配行尾(使用「\___FCKpd___0rdquo;表示單純的 「___FCKpd___0rdquo;字符);被替換的內容爲空;因爲一行最多隻需替換一次,不須要特殊標誌。這個仍是比較簡單 的。(/<Space><Tab>)
2,去掉全部的空白行:「:%s/\(\s*\n\)\+/\r/」。這回多了「 \(」、「\)」、「\n」、「\r」和 「*」。「*」表明對前面的字符(此處爲「\s」)匹配零次或屢次(越多越好;使用「\*」表示單純的「*」字符),「\n」表明換行符,「\r」表明回 車符,「\(」和「\)」對錶達式進行分組,使其被視做一個不可分割的總體。所以,這個表達式的完整意義是,把連續的換行符(包含換行符前面可能有的連續 空白字符)替換成爲一個單個的換行符。惟一很特殊的地方是,在模式中使用的是「\n」,而被替換的內容中卻不能使用「\n」,而只能使用「\r」。緣由是 歷史形成的,詳情若是有興趣的話能夠查看「:help NL-used-for-Nul」。
3,去掉全部的「//」註釋:「:%s!\ s*//.*!!」。首先能夠注意到,這兒分隔符改用了「!」,緣由是在模式或字符串部分使用了「/」字符,不換用其餘分隔符的話就得在每次使用「/」字 符自己時寫成「\/」,上面的命令得寫成「:%s/\s*\/\/.*//」,可讀性較低。命令自己卻是至關簡單,用過正則表達式的人估計都知道「.」匹 配表示除換行符以外的任何字符吧。
4,去掉全部的「/* */」註釋:「:%s!\s*/\*\_.\{-}\*/\s*! !g」。這個略有點複雜了,用到了幾個不太經常使用的 Vim 正則表達式特性。「\_.」匹配包含換行在內的全部字符;「\{-}」表示前一個字符可出現零次或屢次,但在整個正則表達式能夠匹配成功的前提下,匹配的 字符數越少越好;標誌「g」表示一行裏能夠匹配和替換屢次。替換的結果是個空格的目的是保證像「int/* space not necessary around comments */main()」這樣的表達式在替換以後仍然是合法的。
:g/^\s*$/d 刪除只有空白的行
:s/\(\w\+\)\s\+\(\w\+\)/\2\t\1 將 data1 data2 修改成 data2 data1
:%s/\(\w\+\), \(\w\+\)/\2 \1/ 將 Doe, John 修改成 John Doe
:%s/\<id\>/\=line(".") 將各行的 id 字符串替換爲行號
:%s/\(^\<\w\+\>\)/\=(line(".")-10) .".". submatch(1) 將每行開頭的單詞替換爲(行號-10).單詞的格式,如第11行的word替換成1. word
排序 :/OB/+1,$!sort
http://www.cnblogs.com/PegasusWang/p/3153300.html
:s/\<four\>/4/g " 將全部的four替換成4,可是fourteen中的four不替換
/\(a\+\)[^a]\+\1 " 查找開頭和結尾處a的個數相同的字符串," 如 aabbbaa,aaacccaaa,可是不匹配 abbbaa