python面試的100題(21)

正則表達式

94.請寫出一段代碼用正則匹配出ip?

ip地址的生成規則。html

  IP地址,是由32位數字二進制轉爲四個十進制的字符串組成。python

  怎麼轉化?下面講解:git

      二進制:11111111111111111111111111111111github

      分爲四部分:11111111.11111111.11111111.11111111正則表達式

      轉化:2^7+2^6+2^5+2^4+2^3+2^2+2^1+2^0=255編程

      轉爲十進制範圍:0~255.0~255.0~255.0~255函數

      這就是IP地址的範圍。url

      根據這個生成IP的規則和範圍,咱們能夠用正則表達式來匹配出IP地址,但怎麼匹配呢?各人有各人的方法,這裏我講解一下個人思路。spa

      根據IP地址的字符串規律,我把匹配IP地址的表達式分爲兩部分來考慮。.net

      第一部分:匹配3個0~255.(注意後面的一個點)

      第二部分:匹配最後的數字0~255

      也就是說,先匹配出 0~255.(注意後面的一個點) 這個字符串,而後重複匹配3次,而後再匹配最後的數字部分0~255。這就是我匹配IP地址的思路。

       首先,我要提一下,正則是沒有辦法作數字運算的,因此,咱們沒法用數字運算的方式篩選出IP的數字範圍。既然無法用數字運算的方式篩選出IP的數字範圍,那麼咱們應該用什麼其餘方式來篩選這個數字範圍呢?個人思路是分組討論,而後再把這些分組合並起來組成IP的數字範圍。

       ①、假設IP的數字是百位數,那麼根據IP的數字範圍,咱們能夠得出下面幾種狀況。假設第一個數字爲1,那麼這個數字的範圍就爲1[0-9][0-9]。這個應該不難理解,就不解釋。

      ②、假設第一個數字爲2,那麼根據IP數字的範圍規則,這裏又要分爲兩種狀況,爲何?你想一想,最大數字是255,當十位數爲5時,個位數最大隻能爲5是吧?而當十位數爲0到4時,個位數能夠是任意數字對吧?

      因此,這裏的兩種狀況分別爲:

           A、2[0-4][0-9]

           B、25[0-5]

       ③、分析完了百位數的狀況,接下來就是十位數的狀況了,假如是十位數,那麼十位數的前面第一個數不能爲零是吧?

因此十位數的狀況能夠是:[1-9][0-9]

       ④、剩下的就是個位數的狀況了,個位數的狀況,你們應該很容易得出結論,就是:[0-9]。

       四種狀況分析下來,咱們得出了IP數字的範圍分組爲:

        1[0-9][0-9]

        2[0-4][0-9]

        25[0-5]

        [1-9][0-9]

        [0-9]

       怎麼把上面的分組用正則表達式表示出來呢?很簡單,用正則的或符號|和分組符號()就能夠了,因此上面的分組正則表達式爲:

(1[0-9][0-9])|(2[0-4][0-9])|(25[0-5])|([1-9][0-9])|([0-9])

寫到這裏,數字的匹配範圍正則表達式已經寫好了,那麼根據我前面的思路: 第一部分:匹配3個0~255.(注意後面的一個點)

         第二部分:匹配最後的數字0~255

        咱們來匹配IP地址的第一部分,正則表達式以下: 

(1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9]\.)

我在每一個數字的後面加了一個點就是匹配出0~255.(注意後面的一個點)

         那麼怎麼重複匹配三次呢?很簡單,咱們只要把這五個分組當成總體,再重複匹配三次就好了,正則表達式以下:

((1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9])\.)){3}

第一部分已經匹配出來了,接下來就是拼接上第二部分的數字了,數字部分上面已經寫得很清楚了,就再也不解釋了,下面是完整的正則表達式:

((1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9]\.)){3}((1[0-9][0-9])|(2[0-4][0-9])|(25[0-5])|([1-9][0-9])|([0-9]))

參考地址:https://blog.csdn.net/znzxc/article/details/84061280

96.Python字符串查找和替換?

Python 截取字符串使用 變量[頭下標:尾下標],就能夠截取相應的字符串,其中下標是從0開始算起,能夠是正數或負數,下標能夠爲空表示取到頭或尾。

# 例1:字符串截取
str = '12345678'
print str[0:1]
>> 1            # 輸出str位置0開始到位置1之前的字符
print str[1:6]        
>> 23456            # 輸出str位置1開始到位置6之前的字符
num = 18
str = '0000' + str(num)    # 合併字符串
print str[-5:]        # 輸出字符串右5位
>> 00018            

Python 替換字符串使用 變量.replace("被替換的內容","替換後的內容"[,次數]),替換次數能夠爲空,即表示替換全部。要注意的是使用replace替換字符串後僅爲臨時變量,需從新賦值才能保存。

# 例2:字符串替換
str = 'akakak'
str = str.replace('k',' 8')    # 將字符串裏的k所有替換爲8
print str
>> 'a8a8a8'        # 輸出結果

Python 查找字符串使用 變量.find("要查找的內容"[,開始位置,結束位置]),開始位置和結束位置,表示要查找的範圍,爲空則表示查找全部。查找到後會返回位置,位置從0開始算,若是每找到則返回-1。

# 例3:字符串查找
str = 'a,hello'
print str.find('hello')    # 在字符串str裏查找字符串hello
>> 2            # 輸出結果

Python 分割字符串使用 變量.split("分割標示符號"[分割次數]),分割次數表示分割最大次數,爲空則分割全部。

例4:字符分割
str = 'a,b,c,d'
strlist = str.split(',')    # 用逗號分割str字符串,並保存到列表
for value in strlist:    # 循環輸出列表值
    print value
>> a            # 輸出結果
>> b
>> c
>> d

參考地址:https://www.cnblogs.com/baoendemao/p/3804664.html

98.正則表達式貪婪與非貪婪模式的區別?

1.什麼是正則表達式的貪婪與非貪婪匹配

  如:String str="abcaxc";

    Patter p="ab.*c";

  貪婪匹配:正則表達式通常趨向於最大長度匹配,也就是所謂的貪婪匹配。如上面使用模式p匹配字符串str,結果就是匹配到:abcaxc(ab.*c)。

  非貪婪匹配:就是匹配到結果就好,就少的匹配字符。如上面使用模式p匹配字符串str,結果就是匹配到:abc(ab.*c)。

2.編程中如何區分兩種模式

  默認是貪婪模式;在量詞後面直接加上一個問號?就是非貪婪模式。

  量詞:{m,n}:m到n個

     *:任意多個

     +:一個到多個

     ?:0或一個

參考地址:https://www.cnblogs.com/xudong-bupt/p/3586889.html

99.寫出開頭匹配字母和下劃線,末尾是數字的正則表達式?

1.由數字、26個英文字母或者下劃線組成的字符串:
    ^[0-9a-zA-Z_]{1,}$
2.非負整數(正整數 + 0 ):
    ^/d+$
3. 正整數:
    ^[0-9]*[1-9][0-9]*$
4.非正整數(負整數 + 0):
    ^((-/d+)|(0+))$
5. 負整數 :
    ^-[0-9]*[1-9][0-9]*$
6.整數:    
    ^-?/d+$
7.非負浮點數(正浮點數 + 0):
    ^/d+(/./d+)?$
8.正浮點數 :
    ^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$
9. 非正浮點數(負浮點數 + 0):
    ^((-/d+(/./d+)?)|(0+(/.0+)?))$
10.負浮點數 :
    ^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$
11. 浮點數 :
    ^(-?/d+)(/./d+)?$
12.由26個英文字母組成的字符串 :    
    ^[A-Za-z]+$
13. 由26個英文字母的大寫組成的字符串 :
    ^[A-Z]+$
14.由26個英文字母的小寫組成的字符串 :
    ^[a-z]+$
15. 由數字和26個英文字母組成的字符串 :
    ^[A-Za-z0-9]+$
16.由數字、26個英文字母或者下劃線組成的字符串 :    
    ^/w+$
17.email地址 :
    ^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$
18.url:    
    ^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$
19. 年-月-日:
    /^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/
20.月/日/年:
    /^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/
21.Emil:
    ^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$
22. 電話號碼:
    (d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?
23.IP地址:
    ^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$
24. 匹配中文字符的正則表達式:
    [/u4e00-/u9fa5]
25.匹配雙字節字符(包括漢字在內):
    [^/x00-/xff]
26. 匹配空行的正則表達式:
    /n[/s| ]*/r
27.匹配HTML標記的正則表達式:
    /<(.*)>.*<///1>|<(.*) //>/
28.匹配首尾空格的正則表達式:
    (^/s*)|(/s*$)
29.匹配Email地址的正則表達式:
    /w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
30. 匹配網址URL的正則表達式:
    ^[a-zA-z]+://(//w+(-//w+)*)(//.(//w+(-//w+)*))*(//?//S*)?$
31. 匹配賬號是否合法(字母開頭,容許5-16字節,容許字母數字下劃線):
    ^[a-zA-Z][a-zA-Z0-9_]{4,15}$
32. 匹配國內電話號碼:
    (/d{3}-|/d{4}-)?(/d{8}|/d{7})?
33.匹配騰訊QQ號:
    ^[1-9]*[1-9][0-9]*$
34. 只能輸入數字:
    ^[0-9]*$
35.只能輸入n位的數字:
    ^/d{n}$
36.只能輸入至少n位的數字:
    ^/d{n,}$
37.只能輸入m~n位的數字:
    ^/d{m,n}$
38.只能輸入零和非零開頭的數字:
    ^(0|[1-9][0-9]*)$
39.只能輸入有兩位小數的正實數:
    ^[0-9]+(.[0-9]{2})?$
40. 只能輸入有1~3位小數的正實數:
    ^[0-9]+(.[0-9]{1,3})?$
41.只能輸入非零的正整數:
    ^/+?[1-9][0-9]*$
42. 只能輸入非零的負整數:
    ^/-[1-9][0-9]*$
43.只能輸入長度爲3的字符:
    ^.{3}$
44. 只能輸入由26個英文字母組成的字符串:
    ^[A-Za-z]+$
45.只能輸入由26個大寫英文字母組成的字符串:
    ^[A-Z]+$
46. 只能輸入由26個小寫英文字母組成的字符串:
    ^[a-z]+$
47.只能輸入由數字和26個英文字母組成的字符串:
    ^[A-Za-z0-9]+$
48. 只能輸入由數字和26個英文字母或者下劃線組成的字符串:
    ^/w+$
49.驗證用戶密碼(正確格式爲: 以字母開頭,長度在5~17 之間,只能包含字符、數字和下劃線)
    ^[a-zA-Z]/w{5,17}$
50.驗證是否包含有 ^%&',;=?$/"等字符:
    [^%&',;=?$/x22]+
51.只能輸入漢字:
    ^[\u4e00-\u9fa5]{0,}$
5二、只含有漢字、數字、字母、下劃線不能如下劃線開頭和結尾
    ^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$
5三、只含有漢字、數字、字母、下劃線,下劃線位置不限
    ^[a-zA-Z0-9_\u4e00-\u9fa5]+$
5四、2~4個漢字
    @"^[\u4E00-\u9FA5]{2,4}$

5五、

第一位是【1】開頭,第二位則則有【3,4,5,7,8】,第三位則是【0-9】,第三位以後則是數字【0-9】。
var reg = /^1[3|4|5|7|8][0-9]{9}$/;
手機號第二位不作限制
var reg = /^1[0-9]{10}$/;

參考地址:https://www.cnblogs.com/J-xiaoyu/p/9619640.html

100.正則表達式操做

四大操做:匹配,切割,替換,獲取

103.簡述Python裏面search和match的區別

match()函數只檢測字符串開頭位置是否匹配,匹配成功纔會返回結果,不然返回None

import re
print(re.match("func", "function"))
# 打印結果 <_sre.SRE_Match object; span=(0, 4), match='func'>

print(re.match("func", "function").span())
# 打印結果  (0, 4)

print(re.match("func1", "function"))
# 打印結果 None

注意:print(re.match("func1", "function").span())會報錯,由於取不到span

search()函數會在整個字符串內查找模式匹配,只到找到第一個匹配而後返回一個包含匹配信息的對象,該對象能夠經過調用group()方法獲得匹配的字符串,若是字符串沒有匹配,則返回None。

import re
print(re.search("tion", "function"))
# 打印結果 <_sre.SRE_Match object; span=(4, 8), match='tion'>

print(re.search("tion", "function").span())
# 打印結果  (4, 8)

print(re.search("tion1", "function"))
# 打印結果 None

注意:print(re.search("tion1", "function").span())會報錯,由於取不到tion1

re模塊下的其餘經常使用方法

import re

print(re.findall("a", "a aa ab ac"))  # 返回全部知足匹配條件的結果,放在列表裏
# ['a', 'a', 'a', 'a', 'a']

print(re.split('[ab]', 'abcd'))  # 先按'a'分割獲得''和'bcd',在對''和'bcd'分別按'b'分割
# ['', '', 'cd']

ret = re.sub('\d', 'H', 'eva3egon4yuan4', 1)#將數字替換成'H',參數1表示只替換1個
print(ret) #evaHegon4yuan4

ret = re.subn('\d', 'H', 'eva3egon4yuan4')#將數字替換成'H',返回元組(替換的結果,替換了多少次)
print(ret)

obj = re.compile('\d{3}')  #將正則表達式編譯成爲一個 正則表達式對象,規則要匹配的是3個數字
ret = obj.search('abc123eeee') #正則表達式對象調用search,參數爲待匹配的字符串
print(ret.group())  #結果 : 123

import re
ret = re.finditer('\d', 'ds3sy4784a')   #finditer返回一個存放匹配結果的迭代器
print(ret)  # <callable_iterator object at 0x10195f940>
print(next(ret).group())  #查看第一個結果
print(next(ret).group())  #查看第二個結果
print([i.group() for i in ret])  #查看剩餘的左右結果

注意:

1 findall的優先級查詢:

import re

ret = re.findall('www.(baidu|jd).com', 'www.jd.com')
print(ret)  # ['jd']     這是由於findall會優先把匹配結果組裏內容返回,若是想要匹配結果,取消權限便可

ret = re.findall('www.(?:baidu|jd).com', 'www.jd.com')
print(ret)  # ['www.jd.com']

2 split的優先級查詢

ret=re.split("\d+","eva3egon4yuan")
print(ret) #結果 : ['eva', 'egon', 'yuan']

ret=re.split("(\d+)","eva3egon4yuan")
print(ret) #結果 : ['eva', '3', 'egon', '4', 'yuan']

#在匹配部分加上()以後所切出的結果是不一樣的,
#沒有()的沒有保留所匹配的項,可是有()的卻可以保留了匹配的項,
#這個在某些須要保留匹配部分的使用過程是很是重要的。

參考地址:https://www.cnblogs.com/aaronthon/p/9435967.html

相關文章
相關標籤/搜索