14.正則表達式、re模塊、元字符

     正則表達式     

 

1、正則表達式所面向的問題

一、判斷一個字符串是否匹配給定的格式正則表達式

判斷用戶註冊賬號是否知足格式spa

二、從一個字符串中按指定格式提取信息3d

抓取頁面中的連接對象

2、判斷用戶提交的郵箱的格式是否正確

3、抓取頁面中特定部分數據

 

        er模塊        

一、findall方法:

在字符串中找到正則表達式所匹配的全部子串,並返回一個列表 ,若是沒有找到匹配的,則返回空列表

二、match方法

re.match 嘗試從字符串的起始位置匹配一個模式,匹配成功 返回的是一個匹配 對象(這個對象包含了咱們匹配的信息),若是不是起始位置匹配成功的話, match()返回的是空

三、search方法

re.search 掃描整個字符串,匹配成功 返回的是一個匹配對象(這個對象包含了咱們匹配的信息)

注意:search也只能匹配到一個,找到符合規則的就返回,不會一直日後找

        元字符        

                                                 自己具備特殊含義的字符blog

           1.單字符匹配                                                 2.表明數量的元字符                                   

 

                   3.表示邊界的元字符                                       4.分組匹配

5.貪婪與非貪婪字符串

正則默認都是用貪婪模式去匹配數據的,就是儘量多的匹配符合要求的數據,在非貪 婪模式下,始終找最短匹配io

 

相關文章
相關標籤/搜索