如何用機器學習對文本分類

時間 2021-01-12

原文原文鏈接

需求使用監督學習對歷史數據訓練生成模型，用於預測文本的類別。樣本清洗主要將重複的數據刪除掉，將錯誤無效的數據糾正或刪除，並檢查數據的一致性等。比如我認爲長度小於少於13的數據是無效的遂將之刪掉。 def writeFile(text): file_object = open('result.txt','w') file_object.write(text) file_obj

>>阅读原文<<