RE

正則表達式在爬蟲和處理字符串的過程中常常會被用到,例如解決下面兩個問題 (1)去除爬取到的結果裏面的特殊字符/[^] (2)我只想讓文本中留下中文字符。 python的re包提供了強大的正則表達式應用,能讓我們方便的解決類似上面的問題。具體的步驟也比較簡單 (1)首先我們要根據正則表達式的規則寫出我們想要去尋找或者匹配的模式,例如:[^\u4E00-\u9FD5]+,是說匹配除了中文以外的字符 (
相關文章
相關標籤/搜索