輿情監控系統——step2.利用SVM實現中文文本分類

時間 2019-12-05

標籤輿情監控系統 step2 step 利用 svm 實現中文文本分類简体版

原文原文鏈接

先放GitHub代碼，若是以爲寫得不錯，記得加個star哦，嘻嘻～git 基本流程一、準備好數據食材、去停用詞並利用結巴(jieba)進行分詞處理github 數據食材選用參考：NLP中必不可少的語料資源web jieba分詞模塊參考官方文檔啦～算法 # 參照代碼中的cutWords.py文件二、利用卡方檢驗特徵選擇svg 卡方檢驗：在構建每一個類別的詞向量後，對每一類的每個單詞進行其卡方統計

>>阅读原文<<