python 過濾文本中的標點符號(轉)

網上搜到的大都太複雜,最後找到一個用正則表達式實現的:正則表達式

import re
s = "string. With. Punctuation?"
# 若是空白符也須要過濾,使用 r'[^\w]'
s = re.sub(r'[^\w\s]','',s)

支持中文和中文標點。spa

原理很簡單:在正則表達式中,\w 匹配字母或數字或下劃線或漢字(具體與字符集有關),^\w 表示相反匹配。code

轉自:http://baimoz.me/1656/blog

相關文章
相關標籤/搜索