中文文本分類

        將文本進行分類是自然語言處理當中最主要的工作之一,本文處理很重要的一項工作就是對文本進行向量化,本文不做詳細的介紹,只是採用TF-IDF的方法對文本進行向量化,然後分別採用SVM,  Bayes,  RandomForest,BP四種方法對文本進行分類。 訓練語料是在excel中存儲的,格式見下圖: data = pd.read_excel('../corpus.xlsx', en
相關文章
相關標籤/搜索