用python進行數據預處理,過濾特殊符號,英文和數字。(適用於中文分詞)

要進行中文分詞,必需要求數據格式所有都是中文,需求過濾掉特殊符號、標點、英文、數字等。固然了用戶能夠根據本身的要求過濾自定義字符。 實驗環境:python、mysqlpython 實驗目的:從數據庫讀取數據,過濾點無用字符,而後存入到數據庫一個表裏面。mysql 代碼以下:web # -*- coding: UTF-8 -*- import MySQLdb as mdb import re de
相關文章
相關標籤/搜索