Python正則表達式由淺入深(一)

CDA數據分析師 出品 數據分析工作中很多任務是跟文本處理相關,比如從文本中提取客戶的信息,從文本中提取時間等等都是比較常見的操作。 雖然Python處理字符串的方法很多,而且流行的pandas庫也提供了大量的向量化字符串方法,但是一旦涉及要經過較爲複雜的數據匹配才能進行的字符操作,這些方法就顯得非常的乏力。 尤其是由於文本數據來源於爬蟲等渠道,數據往往嚴重不規整,這時候文本處理起來就顯得尤爲吃力
相關文章
相關標籤/搜索