語法:python
re.split(pattern, string[, maxsplit=0, flags=0])正則表達式
參數:函數
pattern 匹配的正則表達式spa
string 要匹配的字符串。對象
maxsplit 分隔次數,maxsplit=1 分隔一次,默認爲 0,不限制次數。字符串
>>>import restring
>>> re.split('\W+', 'runoob, runoob, runoob.')it
['runoob', 'runoob', 'runoob', '']class
>>> re.split('(\W+)', ' runoob, runoob, runoob.')import
['', ' ', 'runoob', ', ', 'runoob', ', ', 'runoob', '.', '']
>>> re.split('\W+', ' runoob, runoob, runoob.', 1)
['', 'runoob, runoob, runoob.']
>>> re.split('[,\.]',r'hello,Tom.how are you')
['hello', 'Tom', 'how are you']
>>> re.split('a*', 'hello world')
['hello world']
語法:
re.sub(pattern, repl, string, count=0, flags=0)
pattern.sub(repl, string[, count = 0])
參數:
能夠使用\id或\g<id>、\g<name>引用分組,但不能使用編號0。
它必須傳一個Match對象,並必須返回一個字符串用於替換(返回的字符串中不能再引用分組)。
這個函數跟sub函數用法差很少,只是它有一個額外的特徵,結果是返回一個tuple,tuple第 一個元素是替換後的新字符串,第二個元素是替換的次數。
import re
def add(m):
v = int(m.group(0))
return str(v + 1)
p = re.compile("(\d+)")
result = p.subn(add, "1 2 3 4 5")
print result
>>>('2 3 4 5 6', 5)
能夠將字符串中全部可能被解釋爲正則運算符的字符進行轉譯。
>>> re.escape('www.python.org')
'www\\.python\\.org'