1. re.sub("須要被替換的正則表達式","須要替換的字符串","須要處理的原始的字符串") 例子: myStr = "<b>我是b</b><i>我是i</i><strong>我是strong</strong>" # 將b換成em 即<em>第三方</em> data = re.sub("<b>(.*?)</b>", "<em>我是em</em>", myStr) print(data) # <em>我是em</em><i>我是i</i><strong>我是strong</strong> # 將全部的標籤名換成em,不改變標籤內的內容 data = re.sub("<b>(.*?)</b><i>(.*?)</i><strong>(.*?)</strong>", "<em>\\1</em><em>\\2</em><em>\\3</em>",myStr) print(data) # 其中\1是取第一個(.*?)獲取的內容, \2是第二個(.*?)的內容,...。<em>我是b</em><em>我是i</em><em>加粗strong</em> # 將1970/01/02變爲01月02日1970年(考察分組,內容的獲取) myData = "1970/01/02" ret = re.sub("(\d+)/(\d+)/(\d+)", "\\2月\\3日\\1年", myData) print(ret) # 01月02日1970年 打印結果: <em>我是em</em><i>我是i</i><strong>我是strong</strong> <em>我是b</em><em>我是i</em><em>我是strong</em> 01月02日1970年 例子2: 替換字符串中的空格 用 + 代替 keyword = 'girl dress haha' out = re.sub('\s', '+' ,keyword) print(out) 打印: girl+dress+haha
title_re = '<span itemprop="name">W.L.MONSOON Princess <font><b>Dress</b></font> Long Sleeve <font><b>Dresses</b></font> for <font><b>Girls</b></font></span>' pat = '<font><b>(.*?)</b></font>' data_pa = re.sub('<font><b>(.*?)</b></font>','\\1',title_re) print(data_pa)
打印: python
<span itemprop="name">W.L.MONSOON Princess Dress Long Sleeve Dresses for Girls</span>
提取不是數字的字符串正則表達式
sss= '2abc'
AA= re.sub('\d','',sss)
AAspa