python實現txt文本數據分類——中英文分類

最近在作天然語言處理的數據預處理部分——實體詞,提取、抓取的數據集中包含中英文,那麼咱們只須要英文,不須要中文,因而就寫了一個簡單的腳本實現txt文本數據分類。 原數據以下(爲了寫這篇博客特地只提取了數據的一部分): 代碼以下:web file_open = open(r'C:\Users\Administrator\Desktop\words.txt', 'r', encoding='gbk')
相關文章
相關標籤/搜索