正則表達式

正則表達式的建立、匹配字符串、轉義、字符類、重複以及經常使用字符javascript

首先是工具推薦:css

http://tools.jb51.net/regex/create_reghtml

http://tools.jb51.net/regex/javascriptjava

 


 

i ignoreCase 忽略大小寫node

g global 全局正則表達式

m multiline 多行數組

 


 

正則匹配函數

pattern.test(str)工具

pattern.exec(str)spa

 


 

修飾符的用法

var pattern = new RegExp('js', 'i');
var pattern = /js/i;

用戶輸入獲取要匹配的文本

var pattern = '/' + userInput + '/i';
var pattern = new RegExp(userInput, 'i');

轉義字符 \

匹配換行符 \n

    var str = '1.html\n2.css\n3.js';
    var pattern = /\n/;
    console.log(str);
    console.log(pattern.exec(str));

話說這個換行符好Q

 


 

匹配空格\t

 


 

十六進制匹配\x開頭:

a=\x61

b=\x62

\n=\x0A

    var str = 'a\nb';
    var pattern = /\x61\x0A\x62/;
    console.log(pattern.exec(str));

unicode表示:

\u0009=\t 空白符

    var str = '    js';
    var pattern = /\u0009/;
    console.log(pattern.exec(str));

基本漢字unicode範圍:\u4e00-\u9fa5

 


 

方括號是單個匹配,表示出現j或者s

    var str = 'sjavascript';
    var pattern = /[js]/;

^在[]裏面表明非

^在[]外面表明是爲首

    var str = 'jscript';
    var pattern = /[^js]/;//不是j或者s
    console.log(pattern.exec(str));

.表明任意字符,但不能匹配\n

    var str = '\n';
    var pattern = /./;
    console.log(pattern.exec(str));

/[a-zA-Z0-9_]/ /\w/ =數字字母下劃線

/[^a-zA-Z0-9_]/ /\W/ =非數字字母下劃線

\d 匹配數字

\s 匹配空格

 


 

匹配價格

    var str = '肯德基豪華午飯:¥15.5!';
    var pattern = /\d{1,}\.{0,1}\d{0,}/;
    console.log(pattern.exec(str));

+ 匹配一次或更屢次的重複
+?匹配一次或更屢次的重複,可是在能使整個匹配成功的前提下使用最少的重複

貪婪模式

    var str = '<td><p>a</p></td><td><p>b</p></td>';
    var pattern = /<td>.*<\/td>/;
    console.log(pattern.exec(str));

懶惰模式

    var str = '<td><p>a</p></td><td><p>b</p></td>';
    var pattern = /<td>.*?<\/td>/;
    console.log(pattern.exec(str));

正則表達式的() [] {} 有着不一樣的意思

() 是爲了提取匹配字符串的,表達式中有幾個()就有幾個相應的匹配字符串

(abc)? 表示這一組要麼一塊兒出現,要麼不出現,出現那則按順序出現。

(?:abc)表示找到同樣abc的一組,可是不記錄,不保存到&#x53D8;&#x91CF;&#x4E2D;&#xFF0C;&#x5426;&#x5219;&#x53EF;&#x4EE5;&#x901A;&#x8FC7;" role="presentation" style="overflow-wrap: normal; max-width: none; max-height: none; min-width: 0px; min-height: 0px; float: none;" id="MathJax-Element-1-Frame">變量中,不然能夠經過變量中,不然能夠經過x取第幾個括號所匹配到的項。好比(aaa)(bbb)(ccc)(?:ddd)(eee)能夠用1&#x83B7;&#x53D6;(aaa)&#x5339;&#x914D;&#x5230;&#x7684;&#x5185;&#x5BB9;&#xFF0C;&#x800C;" role="presentation" style="overflow-wrap: normal; max-width: none; max-height: none; min-width: 0px; min-height: 0px; float: none;" id="MathJax-Element-2-Frame">1獲取(aaa)匹配到的內容,而1獲取(aaa)匹配到的內容,而3則獲取到了(ccc)匹配到的內容,而$4則獲取的是由(eee)。

a(?=bbb)順序環視 表示a後面必須緊跟3個連續的b

(\s*)表示連續空格的字符串

 


 

[] 是定義匹配的字符範圍。好比[a-zA-Z0-9]表示相應位置的字符要匹配英文字符和數字。[\s*表示空格或者*號]

{}通常是用來匹配的長度。好比\s{3}表示匹配三個空格,\s[1,3]表示匹配1到3個空格

(0-9)匹配'0-9'自己。[0-9]*匹配數字(注意後面有*,能夠爲空)[0-9]+匹配數字(注意後面有+,不能夠爲空),

{0-9}寫法是錯誤的

[0-9]{0,9}表示長度爲0到9的數字字符串。

 


 

\1 = ab

    var str = '<p><a>這是一段文字</a></p>';
    var pattern = /<([a-zA-Z]+)>(.*?)<\/\1>/;
    console.log(pattern.exec(str));

指定匹配位置

^開始 $結尾

匹配全是數字,方法一:

    var str = '110119120';
    var pattern = /^\d+$/;
    console.log(pattern.exec(str));
    if (pattern.test(str)) {
        console.log('全是數字!');
    } else {
        console.log('不全是數字!');
    }

匹配全是數字,方法二:

    var str = '11011a9120';
    var pattern = /\D/;
    console.log(pattern.exec(str));
    if (pattern.test(str)) {
        console.log('不全是數字!');
    } else {
        console.log('全是數字!');
    }

\b = 單詞邊界

    var str = '@@@js@@@';
    var pattern = /\bjs\b/; //@也被識別爲單詞邊界
    console.log(pattern.exec(str));

經過類名獲取元素

    function getByClassName(className, parentNode) {
        if (document.getElementsByClassName) {
            return document.getElementsByClassName(className);
        } else {
            parentNode = parentNode || document;
            var nodeList = [];
            var allNodes = parentNode.getElementsByTagName('*');
            // 正則匹配某個類名
            var pattern = new RegExp('\\b' + className + '\\b');

            for (var i = 0; i < allNodes.length; i++) {
                if (pattern.test(allNodes[i].className)) {
                    nodeList.push(allNodes[i]);
                }
            }
            // 返回全部匹配到的元素集合
            return nodeList;
        }
    }

\b和\s有什麼區別

\babc\b匹配的是"abc"
\sabc\s匹配的不是"abc", 先後還帶空格" abc "
\b只是匹配字符串開頭結尾及空格回車等的位置, 不會匹配空格符自己

 


 

若是後面緊跟script,則匹配java

    var str = 'javascript';
    var pattern = /java(?=script)/;
    console.log(pattern.exec(str));

正則表達式 - (?!), (?:), (?=)的區別

(?:pattern) 非獲取匹配,匹配pattern但不獲取匹配結果,不進行存儲供之後使用。

(?=pattern) 非獲取匹配,正向確定預查。例如,「Windows(?=95|98|NT|2000)」能匹配「Windows2000」中的「Windows」,但不能匹配「Windows3.1」中的「Windows」。

(?!pattern) 非獲取匹配,正向否認預查,例如「Windows(?!95|98|NT|2000)」能匹配「Windows3.1」中的「Windows」,但不能匹配「Windows2000」中的「Windows」。

(?<=pattern) 非獲取匹配,反向確定預查。例如,「(?<=95|98|NT|2000)Windows」能匹配「2000Windows」中的「Windows」,但不能匹配「3.1Windows」中的「Windows」。

(?<!pattern) 非獲取匹配,反向否認預查,與正向否認預查相似,只是方向相反。例如「(?<!95|98|NT|2000)Windows」能匹配「3.1Windows」中的「Windows」,但不能匹配「2000Windows」中的「Windows」。

 


 

RegExp對象

RegExp實例方法

    var pattern = /js/;
    var pattern = new RegExp('js');

獲取全部的匹配

    var str = '1.js 2.js 3.js';
    var pattern = /js/g;
    var total = 0,
        match = '',
        result;

    while ((result = pattern.exec(str)) != null) {
        total++;
        match += '第' + total + '個匹配到的是:' + result[0] + ', 它的位置是:' + result.index + '\n';
    }
    match += '共找到' + total + '處匹配\n';
    console.log(str);
    console.log(match);

valueOf:返回一個 Number 對象的基本數字值。

toString():把數字轉換爲字符串,使用指定的基數。

toLocalString():把數字轉換爲字符串,使用本地數字格式順序

    var pattern = new RegExp('a\\nb')
    console.log(pattern.toString());//a\nb
    console.log(pattern.toLocaleString());//a\nb
    console.log(pattern.valueOf() === pattern); //a\nb

RegExp實例屬性

ignoreCase:是一個只讀的布爾值,看這個正則表達式是否帶有修飾符i

multiline:是一個只讀的布爾值,看這個正則表達式是否帶有修飾符m

source:是一個只讀的字符串,包含正則表達式的文本

lastIndex:是一個可讀/寫的整數,若是匹配模式中帶有g修飾符,這個屬性存儲在整個字符串中下一次檢索的開始位置,這個屬性會被exec( ) 和 test( ) 方法用到

    var str = 'js js js';
    var pattern = new RegExp('js', 'ig');
    console.log(pattern.ignoreCase); //true
    console.log(pattern.global); //true
    console.log(pattern.multiline); //false
    console.log(pattern.source); //js
    console.log(pattern.exec(str));
    console.log(pattern.lastIndex); //0
    console.log(pattern.exec(str));
    console.log(pattern.lastIndex); //3

RegExp構造函數屬性列表

exec( )接受一個參數時(即要應用模式的字符串),返回包含第一個匹配項信息的數組

包含兩個額外的屬性

index:表示匹配文本的第一個字符的位置

input:表示存放的爲被檢索 的字符串string

lastIndex屬性,返回匹配內容的最後一個索引位置,也就是下一個匹配的開始位置,注意字符串索引從0開始

lastMatch($&)屬性,只讀屬性,若是沒有匹配信息,則該屬性的值爲空字符串

lastParen屬性 只讀靜態屬性,該屬性返回在最近一次匹配檢測中所獲得的最後一個子匹配的值,若是沒有子匹配則返回空字符串

leftContext屬性 返回匹配內容左側的字符信息 該屬性的初始值爲空字符串 ,若是有相應的匹配該屬性的值就會改變

    var str = 'js js js';
    var pattern = /(j)s/;
    pattern.exec(str);
    console.log(RegExp.input);//js js js
    console.log(RegExp.$_); // = input
    console.log(RegExp['$_']); // = input
    console.log(RegExp.lastMatch); //js
    console.log(RegExp['$&']); // = lastMatch
    console.log(RegExp.leftContext);
    console.log(RegExp['$`']); // = leftContext
    console.log(RegExp.rightContext);
    console.log(RegExp["$'"]); // = rightContext
    console.log(RegExp.lastParen);
    console.log(RegExp["$+"]); // = lastParen

String對象中與正則表達式相關的方法

search()

    var str = 'html js js';
    var pattern = /js/g;
    console.log(str.search(pattern));//5

match()

    var str = 'js1\njs2\njs3';
    var pattern = /^js/mg;
    console.log(str);
    console.log(str.match(pattern));

split()

    var str = 'html ,   css  ,   js';
    var pattern = /\s*,\s*/; // 包括,左右出現空格也能匹配到
    console.log(str.split(pattern));

replace()

    var str = 'I love js';
    var pattern = /(js)/;
    document.write(str.replace(pattern, '<strong style="color: red;">$1</strong>'));\

用*屏蔽相關文字

    var str = '中國軍隊和阿扁一塊兒辦證';
    var pattern = /國軍|阿扁|辦證/g;
    console.log(str.replace(pattern, '*'));

 

幾個文字對應幾個*

    var str = '中國軍隊和阿扁一塊兒辦證';
    var pattern = /國軍|阿扁|辦證/g;
    console.log(str.replace(pattern, function ($0) {
        var result = '';
        for (var i = 0; i < $0.length; i++) {
            result += '*';
        }
        return result;
    }));

經常使用的正則表達式

1.QQ

         全是數字

         首位不能爲0

         最少5位(10000)

         目前最多11位?

    /^[1-9]\d{4,10}$/
    /^[1-9]\d{4,}$/

2.暱稱

         中、英文、數字以及下劃線

         2-18位

    /^[\u4e00-\u9fa5a-zA-Z0-9_]{2,18}$/
    /^[\u4e00-\u9fa5\w]{2,18}$/

3.密碼

         6-16位

         不能用空白字符\s

    /^\S{6,16}$/
    /^[\w~!@#$%^\[\]]{6,16}$/

4.去除字符串首尾的空白字符

    var str = '        Alex         ';
    var pattern = /^\s+|\s+$/g;
    console.log(str.replace(pattern, ''));

函數封裝

    function trim(str) {
        return str.replace(/^\s+/, '').replace(/\s+$/, '');
    }
    var str = '        Alex         ';
    console.log('|' + trim(str) + '|');

5.-轉駝峯

    var str = 'background-color';
    var pattern = /-([a-z])/gi;
    console.log(str.replace(pattern, function (all, letter) {
        return letter.toUpperCase();
    }));

函數封裝

    function toCamelCase(str) {
        return str.replace(pattern, function (all, letter) {
            return letter.toUpperCase();
        })
    }

6.匹配HTML標籤

    var str = '<p class="odd" id="odd">123</p>';
    var pattern = /<[^>]+>/g;// <>中間沒有再出現>
    console.log(str.match(pattern));

7.郵箱

                   alex@yahoo.com.cn

                   alex_1@yahoo.com.cn

                   alex_1.a-sdasd.asdasdas.com@yah-o_o.com.adasdsd.cn

    /(?:\w+\.)*\w+@(?:\w+\.)+[a-z]/i
    /^[a-z0-9]+(?:[._-][a-z0-9]+)*@[a-z0-9]+(?:[._-][a-z0-9]+)*\.[a-z]{2,4}$/i

8.URL

         (協議:\/\/)主機名(:端口號)(/路徑)

ftp|http|https|mailto|file:///

    /^(https?:\/\/)?([^:\/]+)(:\d+)?(\/.*)?$/

九、匹配主機名

         /[^:\/]+/

         -www.-imos-oc.casfasf.sadasd.com

    /[a-z0-9]|[a-z0-9][-a-z0-9]*[a-z0-9]/i
    /^([a-z0-9]\.|[a-z0-9][-a-z0-9]*[a-z0-9]\.)*(com|edu|gov|net|org|[a-z]{2})$/i
    /^([a-z0-9]\.|[a-z0-9][-a-z0-9]*[a-z0-9]\.)*([a-z]+)$/i

十、匹配全部字符

    /[\w\W]//[\d\D]//[\s\S]//[^]/

十一、分別寫出匹配正整數、負整數以及既能匹配正整數,也能匹配負整數的正則表達式

提示:1.注意0是整數,不是正整數,也不是負整數

    正整數: /[1-9]\d*/
    負整數: /-[1-9]\d*/
    正整數和負整數:/-?[1-9]\d*/
整數:/0|-?[1-9]\d*/

十二、?禁止貪婪模式,請匹配第一個[]以及它裏面的內容

    var str = 'js[javascript];html[hyper text markup language];css[cascading style sheet];';
    var pattern = /\[.*?\]/; 
    console.log(pattern.exec(str));

1三、html標籤的屬性值既能夠放在""中,也能夠放在''中,例如<p class="box" id='box'></p>

寫出既能匹配""中內容,又可以匹配''中內容的正則表達式  

    /(["'])[^"']\1/

1四、現有字符串'Windows98, WindowsXP, Windows7',請分別寫出匹配後面是XP的Windows和後面不是7的Windows的兩個正則表達式

提示:1.前瞻性匹配和負向前瞻性匹配

    /Windows(?=XP)/
    /Windows(?!7)/

1五、RegExp對象

匹配字符串'weekend,endfor,end'中全部的end,並分別打印出其中的字母e

提示:1.全局匹配 2.exec循環打印

()包起來的會被存儲到結果中

    var str = 'weekend,endfor,end';
    var pattern =/(e)nd/g;
    var result;
    while((result = pattern.exec(str)) != null) {
        console.log(result[1]);
    }

String對象與正則表達式相關的方法

1六、找出字符串'110報警120急救119火警114查詢'中的全部數字,並打印出來

提示:1.全局匹配 2.match

    var str = '110報警120急救119火警114查詢';
    var pattern =/\d+/g;
    console.log(str.match(pattern));

1七、找出字符串'asdfgaaaafdgdgaaaadgsxcvcxva'中出現次數最多的字符,並打印出其出現的次數

提示:1.利用數組排序 2.利用引用匹配相同的字符

    var str = 'asdfgaaaafdgdgaaaadgsxcvcxva';
    var arr = str.split(''); // 轉換成數組
    str = arr.sort().join(''); // 排序以後再拼成字符串,此時相同的字符緊挨在了一塊兒
    var value = ''; // 出現次數最多的字符
    var count = 0; // 出現次數
    var pattern =/(\w)\1+/g; // 匹配緊挨着的相同字符
    str.replace(pattern, function ($0, $1) {
        // $0表示匹配到的全部相同字符,$1表示第一個分組匹配的字符,也就是單個字符
        if (count < $0.length) {
        // 若是$0.length>count,就表示此時匹配到的字符,到目前爲止是出現次數最多的
            count = $0.length;
            value = $1;
        }
    });
    console.log('出現次數最多的字符是:'+value+',共出現'+count + '次');
相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息