ip地址的生成規則。html
IP地址,是由32位數字二進制轉爲四個十進制的字符串組成。python
怎麼轉化?下面講解:git
二進制:11111111111111111111111111111111github
分爲四部分:11111111.11111111.11111111.11111111正則表達式
轉化:2^7+2^6+2^5+2^4+2^3+2^2+2^1+2^0=255編程
轉爲十進制範圍:0~255.0~255.0~255.0~255函數
這就是IP地址的範圍。url
根據這個生成IP的規則和範圍,咱們能夠用正則表達式來匹配出IP地址,但怎麼匹配呢?各人有各人的方法,這裏我講解一下個人思路。spa
根據IP地址的字符串規律,我把匹配IP地址的表達式分爲兩部分來考慮。.net
第一部分:匹配3個0~255.(注意後面的一個點)
第二部分:匹配最後的數字0~255
也就是說,先匹配出 0~255.(注意後面的一個點) 這個字符串,而後重複匹配3次,而後再匹配最後的數字部分0~255。這就是我匹配IP地址的思路。
首先,我要提一下,正則是沒有辦法作數字運算的,因此,咱們沒法用數字運算的方式篩選出IP的數字範圍。既然無法用數字運算的方式篩選出IP的數字範圍,那麼咱們應該用什麼其餘方式來篩選這個數字範圍呢?個人思路是分組討論,而後再把這些分組合並起來組成IP的數字範圍。
①、假設IP的數字是百位數,那麼根據IP的數字範圍,咱們能夠得出下面幾種狀況。假設第一個數字爲1,那麼這個數字的範圍就爲1[0-9][0-9]。這個應該不難理解,就不解釋。
②、假設第一個數字爲2,那麼根據IP數字的範圍規則,這裏又要分爲兩種狀況,爲何?你想一想,最大數字是255,當十位數爲5時,個位數最大隻能爲5是吧?而當十位數爲0到4時,個位數能夠是任意數字對吧?
因此,這裏的兩種狀況分別爲:
A、2[0-4][0-9]
B、25[0-5]
③、分析完了百位數的狀況,接下來就是十位數的狀況了,假如是十位數,那麼十位數的前面第一個數不能爲零是吧?
因此十位數的狀況能夠是:[1-9][0-9]
④、剩下的就是個位數的狀況了,個位數的狀況,你們應該很容易得出結論,就是:[0-9]。
四種狀況分析下來,咱們得出了IP數字的範圍分組爲:
1[0-9][0-9]
2[0-4][0-9]
25[0-5]
[1-9][0-9]
[0-9]
怎麼把上面的分組用正則表達式表示出來呢?很簡單,用正則的或符號|和分組符號()就能夠了,因此上面的分組正則表達式爲:
(1[0-9][0-9])|(2[0-4][0-9])|(25[0-5])|([1-9][0-9])|([0-9])
寫到這裏,數字的匹配範圍正則表達式已經寫好了,那麼根據我前面的思路: 第一部分:匹配3個0~255.(注意後面的一個點)
第二部分:匹配最後的數字0~255
咱們來匹配IP地址的第一部分,正則表達式以下:
(1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9]\.)
我在每一個數字的後面加了一個點就是匹配出0~255.(注意後面的一個點)
那麼怎麼重複匹配三次呢?很簡單,咱們只要把這五個分組當成總體,再重複匹配三次就好了,正則表達式以下:
((1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9])\.)){3}
第一部分已經匹配出來了,接下來就是拼接上第二部分的數字了,數字部分上面已經寫得很清楚了,就再也不解釋了,下面是完整的正則表達式:
((1[0-9][0-9]\.)|(2[0-4][0-9]\.)|(25[0-5]\.)|([1-9][0-9]\.)|([0-9]\.)){3}((1[0-9][0-9])|(2[0-4][0-9])|(25[0-5])|([1-9][0-9])|([0-9]))
參考地址:https://blog.csdn.net/znzxc/article/details/84061280
Python 截取字符串使用 變量[頭下標:尾下標],就能夠截取相應的字符串,其中下標是從0開始算起,能夠是正數或負數,下標能夠爲空表示取到頭或尾。
# 例1:字符串截取 str = '12345678' print str[0:1] >> 1 # 輸出str位置0開始到位置1之前的字符 print str[1:6] >> 23456 # 輸出str位置1開始到位置6之前的字符 num = 18 str = '0000' + str(num) # 合併字符串 print str[-5:] # 輸出字符串右5位 >> 00018
Python 替換字符串使用 變量.replace("被替換的內容","替換後的內容"[,次數]),替換次數能夠爲空,即表示替換全部。要注意的是使用replace替換字符串後僅爲臨時變量,需從新賦值才能保存。
# 例2:字符串替換 str = 'akakak' str = str.replace('k',' 8') # 將字符串裏的k所有替換爲8 print str >> 'a8a8a8' # 輸出結果
Python 查找字符串使用 變量.find("要查找的內容"[,開始位置,結束位置]),開始位置和結束位置,表示要查找的範圍,爲空則表示查找全部。查找到後會返回位置,位置從0開始算,若是每找到則返回-1。
# 例3:字符串查找 str = 'a,hello' print str.find('hello') # 在字符串str裏查找字符串hello >> 2 # 輸出結果
Python 分割字符串使用 變量.split("分割標示符號"[分割次數]),分割次數表示分割最大次數,爲空則分割全部。
例4:字符分割 str = 'a,b,c,d' strlist = str.split(',') # 用逗號分割str字符串,並保存到列表 for value in strlist: # 循環輸出列表值 print value >> a # 輸出結果 >> b >> c >> d
參考地址:https://www.cnblogs.com/baoendemao/p/3804664.html
1.什麼是正則表達式的貪婪與非貪婪匹配
如:String str="abcaxc";
Patter p="ab.*c";
貪婪匹配:正則表達式通常趨向於最大長度匹配,也就是所謂的貪婪匹配。如上面使用模式p匹配字符串str,結果就是匹配到:abcaxc(ab.*c)。
非貪婪匹配:就是匹配到結果就好,就少的匹配字符。如上面使用模式p匹配字符串str,結果就是匹配到:abc(ab.*c)。
2.編程中如何區分兩種模式
默認是貪婪模式;在量詞後面直接加上一個問號?就是非貪婪模式。
量詞:{m,n}:m到n個
*:任意多個
+:一個到多個
?:0或一個
參考地址:https://www.cnblogs.com/xudong-bupt/p/3586889.html
1.由數字、26個英文字母或者下劃線組成的字符串:
^[0-9a-zA-Z_]{1,}$
2.非負整數(正整數 + 0 ):
^/d+$
3. 正整數:
^[0-9]*[1-9][0-9]*$
4.非正整數(負整數 + 0):
^((-/d+)|(0+))$
5. 負整數 :
^-[0-9]*[1-9][0-9]*$
6.整數:
^-?/d+$
7.非負浮點數(正浮點數 + 0):
^/d+(/./d+)?$
8.正浮點數 :
^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$
9. 非正浮點數(負浮點數 + 0):
^((-/d+(/./d+)?)|(0+(/.0+)?))$
10.負浮點數 :
^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$
11. 浮點數 :
^(-?/d+)(/./d+)?$
12.由26個英文字母組成的字符串 :
^[A-Za-z]+$
13. 由26個英文字母的大寫組成的字符串 :
^[A-Z]+$
14.由26個英文字母的小寫組成的字符串 :
^[a-z]+$
15. 由數字和26個英文字母組成的字符串 :
^[A-Za-z0-9]+$
16.由數字、26個英文字母或者下劃線組成的字符串 :
^/w+$
17.email地址 :
^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$
18.url:
^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$
19. 年-月-日:
/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/
20.月/日/年:
/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/
21.Emil:
^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$
22. 電話號碼:
(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?
23.IP地址:
^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$
24. 匹配中文字符的正則表達式:
[/u4e00-/u9fa5]
25.匹配雙字節字符(包括漢字在內):
[^/x00-/xff]
26. 匹配空行的正則表達式:
/n[/s| ]*/r
27.匹配HTML標記的正則表達式:
/<(.*)>.*<///1>|<(.*) //>/
28.匹配首尾空格的正則表達式:
(^/s*)|(/s*$)
29.匹配Email地址的正則表達式:
/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
30. 匹配網址URL的正則表達式:
^[a-zA-z]+://(//w+(-//w+)*)(//.(//w+(-//w+)*))*(//?//S*)?$
31. 匹配賬號是否合法(字母開頭,容許5-16字節,容許字母數字下劃線):
^[a-zA-Z][a-zA-Z0-9_]{4,15}$
32. 匹配國內電話號碼:
(/d{3}-|/d{4}-)?(/d{8}|/d{7})?
33.匹配騰訊QQ號:
^[1-9]*[1-9][0-9]*$
34. 只能輸入數字:
^[0-9]*$
35.只能輸入n位的數字:
^/d{n}$
36.只能輸入至少n位的數字:
^/d{n,}$
37.只能輸入m~n位的數字:
^/d{m,n}$
38.只能輸入零和非零開頭的數字:
^(0|[1-9][0-9]*)$
39.只能輸入有兩位小數的正實數:
^[0-9]+(.[0-9]{2})?$
40. 只能輸入有1~3位小數的正實數:
^[0-9]+(.[0-9]{1,3})?$
41.只能輸入非零的正整數:
^/+?[1-9][0-9]*$
42. 只能輸入非零的負整數:
^/-[1-9][0-9]*$
43.只能輸入長度爲3的字符:
^.{3}$
44. 只能輸入由26個英文字母組成的字符串:
^[A-Za-z]+$
45.只能輸入由26個大寫英文字母組成的字符串:
^[A-Z]+$
46. 只能輸入由26個小寫英文字母組成的字符串:
^[a-z]+$
47.只能輸入由數字和26個英文字母組成的字符串:
^[A-Za-z0-9]+$
48. 只能輸入由數字和26個英文字母或者下劃線組成的字符串:
^/w+$
49.驗證用戶密碼(正確格式爲: 以字母開頭,長度在5~17 之間,只能包含字符、數字和下劃線)
^[a-zA-Z]/w{5,17}$
50.驗證是否包含有 ^%&',;=?$/"等字符:
[^%&',;=?$/x22]+
51.只能輸入漢字:
^[\u4e00-\u9fa5]{0,}$
5二、只含有漢字、數字、字母、下劃線不能如下劃線開頭和結尾
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$
5三、只含有漢字、數字、字母、下劃線,下劃線位置不限
^[a-zA-Z0-9_\u4e00-\u9fa5]+$
5四、2~4個漢字
@"^[\u4E00-\u9FA5]{2,4}$
5五、
第一位是【1】開頭,第二位則則有【3,4,5,7,8】,第三位則是【0-9】,第三位以後則是數字【0-9】。
var reg = /^1[3|4|5|7|8][0-9]{9}$/;
手機號第二位不作限制
var reg = /^1[0-9]{10}$/;
參考地址:https://www.cnblogs.com/J-xiaoyu/p/9619640.html
四大操做:匹配,切割,替換,獲取
match()函數只檢測字符串開頭位置是否匹配,匹配成功纔會返回結果,不然返回None
import re print(re.match("func", "function")) # 打印結果 <_sre.SRE_Match object; span=(0, 4), match='func'> print(re.match("func", "function").span()) # 打印結果 (0, 4) print(re.match("func1", "function")) # 打印結果 None 注意:print(re.match("func1", "function").span())會報錯,由於取不到span
search()函數會在整個字符串內查找模式匹配,只到找到第一個匹配而後返回一個包含匹配信息的對象,該對象能夠經過調用group()方法獲得匹配的字符串,若是字符串沒有匹配,則返回None。
import re print(re.search("tion", "function")) # 打印結果 <_sre.SRE_Match object; span=(4, 8), match='tion'> print(re.search("tion", "function").span()) # 打印結果 (4, 8) print(re.search("tion1", "function")) # 打印結果 None 注意:print(re.search("tion1", "function").span())會報錯,由於取不到tion1
import re print(re.findall("a", "a aa ab ac")) # 返回全部知足匹配條件的結果,放在列表裏 # ['a', 'a', 'a', 'a', 'a'] print(re.split('[ab]', 'abcd')) # 先按'a'分割獲得''和'bcd',在對''和'bcd'分別按'b'分割 # ['', '', 'cd'] ret = re.sub('\d', 'H', 'eva3egon4yuan4', 1)#將數字替換成'H',參數1表示只替換1個 print(ret) #evaHegon4yuan4 ret = re.subn('\d', 'H', 'eva3egon4yuan4')#將數字替換成'H',返回元組(替換的結果,替換了多少次) print(ret) obj = re.compile('\d{3}') #將正則表達式編譯成爲一個 正則表達式對象,規則要匹配的是3個數字 ret = obj.search('abc123eeee') #正則表達式對象調用search,參數爲待匹配的字符串 print(ret.group()) #結果 : 123 import re ret = re.finditer('\d', 'ds3sy4784a') #finditer返回一個存放匹配結果的迭代器 print(ret) # <callable_iterator object at 0x10195f940> print(next(ret).group()) #查看第一個結果 print(next(ret).group()) #查看第二個結果 print([i.group() for i in ret]) #查看剩餘的左右結果
注意:
1 findall的優先級查詢:
import re ret = re.findall('www.(baidu|jd).com', 'www.jd.com') print(ret) # ['jd'] 這是由於findall會優先把匹配結果組裏內容返回,若是想要匹配結果,取消權限便可 ret = re.findall('www.(?:baidu|jd).com', 'www.jd.com') print(ret) # ['www.jd.com']
2 split的優先級查詢
ret=re.split("\d+","eva3egon4yuan") print(ret) #結果 : ['eva', 'egon', 'yuan'] ret=re.split("(\d+)","eva3egon4yuan") print(ret) #結果 : ['eva', '3', 'egon', '4', 'yuan'] #在匹配部分加上()以後所切出的結果是不一樣的, #沒有()的沒有保留所匹配的項,可是有()的卻可以保留了匹配的項, #這個在某些須要保留匹配部分的使用過程是很是重要的。
參考地址:https://www.cnblogs.com/aaronthon/p/9435967.html