python面試的100題（21）

時間 2019-11-11

標籤 python 面試欄目 Python 简体版

原文原文鏈接

正則表達式

94.請寫出一段代碼用正則匹配出ip？

ip地址的生成規則。html

　　IP地址，是由32位數字二進制轉爲四個十進制的字符串組成。python

　　怎麼轉化？下面講解：git

二進制：11111111111111111111111111111111github

分爲四部分：11111111.11111111.11111111.11111111正則表達式

轉化：2^7+2^6+2^5+2^4+2^3+2^2+2^1+2^0=255編程

轉爲十進制範圍：0~255.0~255.0~255.0~255函數

這就是IP地址的範圍。url

根據這個生成IP的規則和範圍，咱們能夠用正則表達式來匹配出IP地址，但怎麼匹配呢？各人有各人的方法，這裏我講解一下個人思路。spa

根據IP地址的字符串規律，我把匹配IP地址的表達式分爲兩部分來考慮。.net

第一部分：匹配3個0~255.（注意後面的一個點）

第二部分：匹配最後的數字0~255

也就是說，先匹配出 0~255.（注意後面的一個點）這個字符串，而後重複匹配3次，而後再匹配最後的數字部分0~255。這就是我匹配IP地址的思路。

首先，我要提一下，正則是沒有辦法作數字運算的，因此，咱們沒法用數字運算的方式篩選出IP的數字範圍。既然無法用數字運算的方式篩選出IP的數字範圍，那麼咱們應該用什麼其餘方式來篩選這個數字範圍呢？個人思路是分組討論，而後再把這些分組合並起來組成IP的數字範圍。

①、假設IP的數字是百位數，那麼根據IP的數字範圍，咱們能夠得出下面幾種狀況。假設第一個數字爲1，那麼這個數字的範圍就爲1[0-9][0-9]。這個應該不難理解，就不解釋。

②、假設第一個數字爲2，那麼根據IP數字的範圍規則，這裏又要分爲兩種狀況，爲何？你想一想，最大數字是255，當十位數爲5時，個位數最大隻能爲5是吧？而當十位數爲0到4時，個位數能夠是任意數字對吧？

因此，這裏的兩種狀況分別爲：

A、2[0-4][0-9]

B、25[0-5]

③、分析完了百位數的狀況，接下來就是十位數的狀況了，假如是十位數，那麼十位數的前面第一個數不能爲零是吧？

因此十位數的狀況能夠是：[1-9][0-9]

④、剩下的就是個位數的狀況了，個位數的狀況，你們應該很容易得出結論，就是：[0-9]。

四種狀況分析下來，咱們得出了IP數字的範圍分組爲：

　　　　　　　　1[0-9][0-9]

　　　　　　　　2[0-4][0-9]

　　　　　　　　25[0-5]

　　　　　　　　[1-9][0-9]

　　　　　　　　[0-9]

怎麼把上面的分組用正則表達式表示出來呢？很簡單，用正則的或符號|和分組符號()就能夠了，因此上面的分組正則表達式爲：

(1[0-9][0-9])|(2[0-4][0-9])|(25[0-5])|([1-9][0-9])|([0-9])

寫到這裏，數字的匹配範圍正則表達式已經寫好了，那麼根據我前面的思路：第一部分：匹配3個0~255.（注意後面的一個點）

第二部分：匹配最後的數字0~255

咱們來匹配IP地址的第一部分，正則表達式以下：　

(1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9]\.)

我在每一個數字的後面加了一個點就是匹配出0~255.（注意後面的一個點）

那麼怎麼重複匹配三次呢？很簡單，咱們只要把這五個分組當成總體，再重複匹配三次就好了，正則表達式以下：

((1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9])\.)){3}

第一部分已經匹配出來了，接下來就是拼接上第二部分的數字了，數字部分上面已經寫得很清楚了，就再也不解釋了，下面是完整的正則表達式：

((1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9]\.)){3}((1[0-9][0-9])|(2[0-4][0-9])|(25[0-5])|([1-9][0-9])|([0-9]))

參考地址：https://blog.csdn.net/znzxc/article/details/84061280

96.Python字符串查找和替換？

Python 截取字符串使用變量[頭下標:尾下標]，就能夠截取相應的字符串，其中下標是從0開始算起，能夠是正數或負數，下標能夠爲空表示取到頭或尾。

# 例1：字符串截取
str = '12345678'
print str[0:1]
>> 1            # 輸出str位置0開始到位置1之前的字符
print str[1:6]        
>> 23456            # 輸出str位置1開始到位置6之前的字符
num = 18
str = '0000' + str(num)    # 合併字符串
print str[-5:]        # 輸出字符串右5位
>> 00018

Python 替換字符串使用變量.replace("被替換的內容"，"替換後的內容"[，次數])，替換次數能夠爲空，即表示替換全部。要注意的是使用replace替換字符串後僅爲臨時變量，需從新賦值才能保存。

# 例2：字符串替換
str = 'akakak'
str = str.replace('k',' 8')    # 將字符串裏的k所有替換爲8
print str
>> 'a8a8a8'        # 輸出結果

Python 查找字符串使用變量.find("要查找的內容"[，開始位置，結束位置])，開始位置和結束位置，表示要查找的範圍，爲空則表示查找全部。查找到後會返回位置，位置從0開始算，若是每找到則返回-1。

# 例3：字符串查找
str = 'a,hello'
print str.find('hello')    # 在字符串str裏查找字符串hello
>> 2            # 輸出結果

Python 分割字符串使用變量.split("分割標示符號"[分割次數])，分割次數表示分割最大次數，爲空則分割全部。

例4：字符分割
str = 'a,b,c,d'
strlist = str.split(',')    # 用逗號分割str字符串，並保存到列表
for value in strlist:    # 循環輸出列表值
    print value
>> a            # 輸出結果
>> b
>> c
>> d

參考地址：https://www.cnblogs.com/baoendemao/p/3804664.html

98.正則表達式貪婪與非貪婪模式的區別？

1.什麼是正則表達式的貪婪與非貪婪匹配

　　如：String str="abcaxc";

　　　　Patter p="ab.*c";

　　貪婪匹配:正則表達式通常趨向於最大長度匹配，也就是所謂的貪婪匹配。如上面使用模式p匹配字符串str，結果就是匹配到：abcaxc(ab.*c)。

　　非貪婪匹配：就是匹配到結果就好，就少的匹配字符。如上面使用模式p匹配字符串str，結果就是匹配到：abc(ab.*c)。

2.編程中如何區分兩種模式

　　默認是貪婪模式；在量詞後面直接加上一個問號？就是非貪婪模式。

　　量詞：{m,n}：m到n個

　　　　　*：任意多個

　　　　　+：一個到多個

　　　　　？：0或一個

參考地址：https://www.cnblogs.com/xudong-bupt/p/3586889.html

99.寫出開頭匹配字母和下劃線，末尾是數字的正則表達式？

1.由數字、26個英文字母或者下劃線組成的字符串:
^[0-9a-zA-Z_]{1,}$
2.非負整數（正整數 + 0 ）:
^/d+$
3. 正整數:
^[0-9]*[1-9][0-9]*$
4.非正整數（負整數 + 0）：
^((-/d+)|(0+))$
5. 負整數 :
^-[0-9]*[1-9][0-9]*$
6.整數:
^-?/d+$
7.非負浮點數（正浮點數 + 0）:
^/d+(/./d+)?$
8.正浮點數 :
^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$
9. 非正浮點數（負浮點數 + 0）:
^((-/d+(/./d+)?)|(0+(/.0+)?))$
10.負浮點數 :
^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$
11. 浮點數 :
^(-?/d+)(/./d+)?$
12.由26個英文字母組成的字符串 :
^[A-Za-z]+$
13. 由26個英文字母的大寫組成的字符串 :
^[A-Z]+$
14.由26個英文字母的小寫組成的字符串 :
^[a-z]+$
15. 由數字和26個英文字母組成的字符串 :
^[A-Za-z0-9]+$
16.由數字、26個英文字母或者下劃線組成的字符串 :
^/w+$
17.email地址 :
^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$
18.url:
^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$
19. 年-月-日:
/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/
20.月/日/年:
/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/
21.Emil:
^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$
22. 電話號碼:
(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?
23.IP地址:
^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$
24. 匹配中文字符的正則表達式：
[/u4e00-/u9fa5]
25.匹配雙字節字符(包括漢字在內)：
[^/x00-/xff]
26. 匹配空行的正則表達式：
/n[/s| ]*/r
27.匹配HTML標記的正則表達式：
/<(.*)>.*<///1>|<(.*) //>/
28.匹配首尾空格的正則表達式：
(^/s*)|(/s*$)
29.匹配Email地址的正則表達式：
/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
30. 匹配網址URL的正則表達式：
^[a-zA-z]+://(//w+(-//w+)*)(//.(//w+(-//w+)*))*(//?//S*)?$
31. 匹配賬號是否合法(字母開頭，容許5-16字節，容許字母數字下劃線)：
^[a-zA-Z][a-zA-Z0-9_]{4,15}$
32. 匹配國內電話號碼：
(/d{3}-|/d{4}-)?(/d{8}|/d{7})?
33.匹配騰訊QQ號：
^[1-9]*[1-9][0-9]*$
34. 只能輸入數字：
^[0-9]*$
35.只能輸入n位的數字：
^/d{n}$
36.只能輸入至少n位的數字：
^/d{n,}$
37.只能輸入m~n位的數字：
^/d{m,n}$
38.只能輸入零和非零開頭的數字：
^(0|[1-9][0-9]*)$
39.只能輸入有兩位小數的正實數：
^[0-9]+(.[0-9]{2})?$
40. 只能輸入有1~3位小數的正實數：
^[0-9]+(.[0-9]{1,3})?$
41.只能輸入非零的正整數：
^/+?[1-9][0-9]*$
42. 只能輸入非零的負整數：
^/-[1-9][0-9]*$
43.只能輸入長度爲3的字符：
^.{3}$
44. 只能輸入由26個英文字母組成的字符串：
^[A-Za-z]+$
45.只能輸入由26個大寫英文字母組成的字符串：
^[A-Z]+$
46. 只能輸入由26個小寫英文字母組成的字符串：
^[a-z]+$
47.只能輸入由數字和26個英文字母組成的字符串：
^[A-Za-z0-9]+$
48. 只能輸入由數字和26個英文字母或者下劃線組成的字符串：
^/w+$
49.驗證用戶密碼(正確格式爲：以字母開頭，長度在5~17 之間，只能包含字符、數字和下劃線)
^[a-zA-Z]/w{5,17}$
50.驗證是否包含有 ^%&',;=?$/"等字符：
[^%&',;=?$/x22]+
51.只能輸入漢字：
^[\u4e00-\u9fa5]{0,}$
5二、只含有漢字、數字、字母、下劃線不能如下劃線開頭和結尾
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$
5三、只含有漢字、數字、字母、下劃線，下劃線位置不限
^[a-zA-Z0-9_\u4e00-\u9fa5]+$
5四、2~4個漢字
@"^[\u4E00-\u9FA5]{2,4}$

5五、

第一位是【1】開頭，第二位則則有【3,4,5,7,8】，第三位則是【0-9】，第三位以後則是數字【0-9】。
var reg = /^1[3|4|5|7|8][0-9]{9}$/;
手機號第二位不作限制
var reg = /^1[0-9]{10}$/;

參考地址：https://www.cnblogs.com/J-xiaoyu/p/9619640.html

100.正則表達式操做

四大操做：匹配，切割，替換，獲取

103.簡述Python裏面search和match的區別

match()函數只檢測字符串開頭位置是否匹配，匹配成功纔會返回結果，不然返回None

import re
print(re.match("func", "function"))
# 打印結果 <_sre.SRE_Match object; span=(0, 4), match='func'>

print(re.match("func", "function").span())
# 打印結果  (0, 4)

print(re.match("func1", "function"))
# 打印結果 None

注意：print(re.match("func1", "function").span())會報錯，由於取不到span

search()函數會在整個字符串內查找模式匹配,只到找到第一個匹配而後返回一個包含匹配信息的對象,該對象能夠經過調用group()方法獲得匹配的字符串,若是字符串沒有匹配，則返回None。

import re
print(re.search("tion", "function"))
# 打印結果 <_sre.SRE_Match object; span=(4, 8), match='tion'>

print(re.search("tion", "function").span())
# 打印結果  (4, 8)

print(re.search("tion1", "function"))
# 打印結果 None

注意：print(re.search("tion1", "function").span())會報錯，由於取不到tion1

re模塊下的其餘經常使用方法

import re

print(re.findall("a", "a aa ab ac"))  # 返回全部知足匹配條件的結果,放在列表裏
# ['a', 'a', 'a', 'a', 'a']

print(re.split('[ab]', 'abcd'))  # 先按'a'分割獲得''和'bcd',在對''和'bcd'分別按'b'分割
# ['', '', 'cd']

ret = re.sub('\d', 'H', 'eva3egon4yuan4', 1)#將數字替換成'H'，參數1表示只替換1個
print(ret) #evaHegon4yuan4

ret = re.subn('\d', 'H', 'eva3egon4yuan4')#將數字替換成'H'，返回元組(替換的結果,替換了多少次)
print(ret)

obj = re.compile('\d{3}')  #將正則表達式編譯成爲一個 正則表達式對象，規則要匹配的是3個數字
ret = obj.search('abc123eeee') #正則表達式對象調用search，參數爲待匹配的字符串
print(ret.group())  #結果 ： 123

import re
ret = re.finditer('\d', 'ds3sy4784a')   #finditer返回一個存放匹配結果的迭代器
print(ret)  # <callable_iterator object at 0x10195f940>
print(next(ret).group())  #查看第一個結果
print(next(ret).group())  #查看第二個結果
print([i.group() for i in ret])  #查看剩餘的左右結果

注意：

1 findall的優先級查詢：

import re

ret = re.findall('www.(baidu|jd).com', 'www.jd.com')
print(ret)  # ['jd']     這是由於findall會優先把匹配結果組裏內容返回,若是想要匹配結果,取消權限便可

ret = re.findall('www.(?:baidu|jd).com', 'www.jd.com')
print(ret)  # ['www.jd.com']

2 split的優先級查詢

ret=re.split("\d+","eva3egon4yuan")
print(ret) #結果 ： ['eva', 'egon', 'yuan']

ret=re.split("(\d+)","eva3egon4yuan")
print(ret) #結果 ： ['eva', '3', 'egon', '4', 'yuan']

#在匹配部分加上（）以後所切出的結果是不一樣的，
#沒有（）的沒有保留所匹配的項，可是有（）的卻可以保留了匹配的項，
#這個在某些須要保留匹配部分的使用過程是很是重要的。