正則表達式
. ^ $ * + ? {} [] \ | () #大多數字母和字符會匹配它們自身,有少數特殊字符咱們稱爲元字符,它們不能匹配自身 #子組匹配和模式重複次數等 . # 匹配除換行符以外的全部的字符 # \ 用於轉義 \d # 匹配0~9的數字 \s # 匹配任意的空白符,包括空格,製表符(Tab),換行符等 \w # 匹配字母或數字或下劃線或漢字等 \b # 表示單詞的邊界 \. # 表示匹配點號自己 \D、\S、\W、\B # 是與小寫的相反的做用 ^ # 脫字符,匹配輸入字符串的開始的位置 $ # 匹配輸入字符串的結束位置 #匹配次數 {M,N} # M和N 爲非負整數,其中M<=N 表示前面的匹配M~N次 {M,} # 表示須要匹配M次 以上 {,N} # 等價於{0~N} {N} # 表示須要匹配N次 * # 匹配前面的子表達式零次或屢次,等價於{0,} + # 匹配前面的子表達式一次或屢次,等價於{1,} ? # 匹配前面的子表達式零次或一次,等價於{0,1} #注:*?、+?、{n,m}? 貪婪與懶惰 #子組匹配 [ ] # 字符類,將要匹配的一類字符集放在[]裏面 #例如: [ . ? * ( ) {} ] # 匹配裏面的這些符號 [0-9] # 匹配0到9的數字至關於\d [^\d] # 匹配除數字之外的字符,至關於\D [a-z] # 匹配全部的小寫字母 [^a-z] # 匹配非小寫字母 | # 至關於或(or)分支條件 #例如: A | B # 匹配字母A或者B 與[AB]是同樣的 #分組 () #分組,將要匹配的一類字符集放在()組成一個小組
# 正則: 就是匹配字符串 import re s= 'gjianengasfasdfjianeng12335748' ##### 普通匹配 本身匹配本身 # 你要找的內容 查找的對象 a = re.findall('jianeng',s ) ## 搜索字符串,以列表類型返回所有能匹配的子串 print(a) #search() # 在一個字符串中搜索,匹配正則表達式的第一個位置,返回match對象 a = re.search('jianeng',s) print(a) #### 正則 語法 a = re.findall('\d{3}',s) print(a) ### . ^ $ * + ? {} [] \ | () # . # 匹配除換行符以外的全部的字符 dian = re.findall('.','a我s\t+=_#$dfa\nsdfas') print(dian) # \ 用於轉義 # \d # 匹配0~9的數字 d = re.findall('\d','abc123') print(d) # \s # 匹配任意的空白符,包括空格,製表符(Tab),換行符等 s = re.findall('\s','abc\nbb\tsadf sdf' ) print(s) # \w # 匹配字母或數字或下劃線或漢字等 w = re.findall('\w','asd_456我i') print(w) # \b # 表示單詞的邊界 b = re.findall(r'read\b','read readapple') print(b) # r'read\b' ,取消 字符串轉義 ## 取消 字符串 轉義 r 例: r'read\b' ## 取消 正則 轉義 \ 例: \. # \. # 表示匹配點號自己 dian = re.findall(r'\.','asdf.asd') #\D、\S、\W、\B # 是與小寫的相反的做用 D= re.findall(r'\D','a123pple') print( D) S = re.findall('\S','abc\nbb\tsadf sdf' ) print(S) b = re.search(r'read\B','read readapple') print( b) ## ^ # 脫字符,匹配輸入字符串的開始的位置 t = re.search('^jianeng','jianengsadfsjianeng') print(t) # $ # 匹配輸入字符串的結束位置 t = re.search('jianeng$','jianengsadfsjianeng') print(t) ##匹配次數 c = re.findall('\d{3}','89ahs123gvbsd34534566') print( c ) #{M,N} c = re.findall('\d{2,5}','89ahs123gvbsd34534566') print( c ) #{M,} # 表示須要匹配M次 以上 c = re.findall('\d{2,}','89ahs123gvbsd34534566') print( c ) # {,N} # 等價於{0~N} c = re.findall('\d{,2}','89ahs1s') print( c ) # * # 匹配前面的子表達式零次或屢次,等價於{0,} x = re.findall( '\d*','fds1525sdfg455' ) print(x) # + # 匹配前面的子表達式一次或屢次,等價於{1,} x = re.findall( '\d+','fds1525sdfg4554585444444545165854444444' ) print(x) # ? # 匹配前面的子表達式零次或一次,等價於{0,1} x = re.findall( '\d?','fds1525sdfg455' ) print(x) #注:*?、+?、{n,m}? 貪婪與懶惰 # 貪婪 , 知足要求,選最大的 tan = re.findall('a.*t','amount at about') print(tan) # 懶惰 ,知足要求,就結束 lan = re.findall('a.*?t','amount at about') print(lan) # #子組匹配 # [ ] # 字符類,將要匹配的一類字符集放在[]裏面 zi = re.findall('[a-z0-9]','fsadf44565_5435') print(zi) # a | b| c zi = re.findall('[abc]','fsadf44565_543b5c') print(zi) # [ . ? * ( ) {} ] # 匹配裏面的這些符號 zi = re.findall( '[.?*(){}]','.?*(){}') print( zi ) ## [^\d] 取反的意思 zi = re.findall( '[^\d]','123456abc') print(zi) ##| # 至關於或(or)分支條件 h = re.findall('abc|jianeng','abcsdfsajianeng') print(h) # () #分組,將要匹配的一類字符集放在()組成一個小組 zu = re.search('xx(jianeng)xx','jianengfsxxjianengxxdgffgfxxjianengxxfgf') print(zu ) # 要jianeng ,xx(jianeng)xx zu = re.findall('xx(jianeng)xx','jianengfsxxjianengxxdgffgfxxjianengxxfgf') print(zu )
#re模塊的經常使用方法 search() # 在一個字符串中搜索匹配正則表達式的第一個位置,返回match對象 findall() # 搜索字符串,以列表類型返回所有能匹配的子串 finditer() # 搜索字符串,返回一個匹配結果的迭代類型,每一個迭代元素是match對象 sub() # 替換 相似於字符串中 replace() 方法 compile() # 編譯正則表達式爲模式對象 re.split() # 將一個字符串按照正則表達式匹配結果進行分割,返回列表類型 #獲取 match對象 中的信息 group() # 返回匹配到的字符串 start() # 返回匹配的開始位置 end() # 返回匹配的結束位置 span() # 返回一個元組表示匹配位置(開始,結束)
example:app
#eg1
re.search('a','abc')
#eg2
re.search('.','ab.cd.ce')ide
#正則元字符
# . ^ $ * + ? {} [] \ | ()spa
#eg3
re.search('\bs\b','abcd s w')
re.search(r'\bs\b','abcd s w')code
#eg4
re.search(r'.','hc')
re.search(r'.','\nhc')對象
'''
\d 匹配0~9的數字
\s 匹配任意的空白符,包括空格,製表符(Tab),換行符等
\w 匹配字母或數字或下劃線或漢字等
\b 表示單詞的邊界
\. 表示匹配點號自己
\D、\S、\W、\B是與小寫的相反的做用
\D除啦數字之外的字符blog
^ 脫字符,匹配輸入字符串的開始的位置
$ 匹配輸入字符串的結束位置
'''繼承
#eg.
re.search(r'\d','ab12')
re.search(r'\s','ab 12')
re.search(r'\w','ab 12')
re.search(r'\w','\ab 12')
re.search(r'\w',r'\ab 12')
re.search(r'\bc\b','abcc c 12')
re.search(r'\b#\b',r'abcc # 12')字符串
re.search(r'\D','abc123')
re.search(r'\.','abc.123')string
re.search(r'^a','abc.123')
re.search(r'^b','abc.123')
re.search(r'3$','abd.123')
#{} 次數
re.search(r'\d{1,3}','12ab23')
re.findall(r'\d{1,3}','12ab233')
re.findall(r'\d{1,3}','12ab234567')
re.findall(r'\d{1,3}','12ab234567890')
re.findall(r'\d{1,}','12ab234567890')
re.findall(r'\d{0,}','12ab234567890abc')
re.findall(r'\d{0,3}','12ab234567890abc1')
re.findall(r'\d{,3}','12ab234567890abc1')
re.findall(r'\d{3}','12ab234567890abc1')
re.findall(r'\d*','12ab234567890abc1') #{0,}
re.findall(r'\d+','12ab234567890abc') #{1,}
re.findall(r'\d?','12ab234567890abc') #{0,1}
re.findall(r'\d*?','12ab234567890abc')
re.findall(r'\d{0,0}','12ab234567890abc')
re.findall(r'\d+?','12ab234567890abc')
re.findall(r'\d{1,1}','12ab234567890abc')
'''
* + 被稱爲貪婪模式
? 被稱爲懶惰模式
只要加?以後,{n,m}裏面就變成{n,n}
'''
#[]
re.findall(r'[\d]','12ab23344')
re.findall(r'[ab]','12ab23344')
re.findall(r'[a|b]','12ab23344')
re.findall(r'[.?*(){}]','12ab.?*(){}23344')
re.findall(r'[0-9]','12ab.?*(){}23344')
re.findall(r'[^\d]','12ab.?*(){}23344') # 這裏 ^ 是取反的意思 脫字符
#()
re.findall(r'(23)','12ab.?*(){}23344')
re.findall(r'(2|3)','12ab.?*(){}23344')
re.findall(r'1(2|3)','12ab.?*(){}23344')
re.findall(r'(\d)','12ab.?*(){}23344')
re.findall(r'(^\d)','12ab.?*(){}23344')
#re模塊
a = re.compile(r'\d')
a.findall('123ab12')
re.findall(r'\d','123ab12')
re.sub('i','o','pythin',1)
'pythin'.replace('i','o',1)
re.split(r'\s','agg bbw cee')
re.split(r'[\s|,]','agg bbw, cee')
re.split(r'\d','c1e3e')
re.match(r'\d','1223ag')
re.match(r'\d','ab1223ag')
re.match(r'g$','ab1223ag')
c = re.search(r'[2|3]','12ab1223ag')
c.group()
c.start()
c.end()
c.span()
#finditer() # 搜索字符串,返回一個匹配結果的迭代類型, # 每一個迭代元素是match對象 s = 'sjianengsdfasjianeng15sadfjianeng666' finditer = re.finditer('jianeng',s) print(finditer ) for i in finditer: print(i) print(i.group()) print(i.start() ) print(i.end() ) print(i.span() ) #sub() # 替換 相似於字符串中 replace() 方法 s2 = re.sub('jianeng','666',s,count=2) print(s2) # compile() # 編譯正則表達式爲模式對象 a = re.compile('jianeng') # a 要匹配jianeng dd='fsadfasfjkjianeng' b = a.findall(dd) print(b ) #re.split() # 將一個字符串按照正則表達式匹配結果進行分割,返回列表類型 c = re.split('jianeng',s,maxsplit=2) print(c)
如今要求你們定義這樣的一個類:
1.這個類,必須含有字符串的全部方法
2.同時這個類 ,包含一個統計方法:
統計輸入字符串裏,英文字母、空格、數字和其餘字符分別出現次數,
並做爲一個字典返回 {'字母': ,'空格': ,'數字': ,'其餘字符:' }
import re class A(str): # 繼承str類便可含有字符串全部方法 def counts(self): # print(self) num = len(re.findall(r'\d', self)) letter = len(re.findall(r'[a-zA-Z]', self)) # print(re.findall(r'[a-zA-Z]', self)) space = len(re.findall(r'\s', self)) other = len(self) - num - letter - space count_number = {"num":num,"letter":letter,"space":space, "other": other} return count_number string = A('My name is Which,age18') # print(string) # print(string.upper()) print(string.counts()) # s = 'hello' # s.upper()