中文文本分類

時間 2021-08-15

標籤文本分類 svm 貝葉斯隨機森林神經網絡简体版

原文原文鏈接

將文本進行分類是自然語言處理當中最主要的工作之一，本文處理很重要的一項工作就是對文本進行向量化，本文不做詳細的介紹，只是採用TF-IDF的方法對文本進行向量化，然後分別採用SVM, Bayes, RandomForest，BP四種方法對文本進行分類。訓練語料是在excel中存儲的，格式見下圖： data = pd.read_excel('../corpus.xlsx', en

>>阅读原文<<