如何用機器學習對文本分類

需求 使用監督學習對歷史數據訓練生成模型,用於預測文本的類別。 樣本清洗 主要將重複的數據刪除掉,將錯誤無效的數據糾正或刪除,並檢查數據的一致性等。比如我認爲長度小於少於13的數據是無效的遂將之刪掉。 def writeFile(text): file_object = open('result.txt','w') file_object.write(text) file_obj
相關文章
相關標籤/搜索