網上搜到的大都太複雜,最後找到一個用正則表達式實現的:正則表達式
import re s = "string. With. Punctuation?" # 若是空白符也須要過濾,使用 r'[^\w]' s = re.sub(r'[^\w\s]','',s)
支持中文和中文標點。spa
原理很簡單:在正則表達式中,\w 匹配字母或數字或下劃線或漢字(具體與字符集有關),^\w 表示相反匹配。code
轉自:http://baimoz.me/1656/blog