輿情監控系統——step2.利用SVM實現中文文本分類

先放GitHub代碼,若是以爲寫得不錯,記得加個star哦,嘻嘻~git 基本流程 一、準備好數據食材、去停用詞並利用結巴(jieba)進行分詞處理github 數據食材選用參考:NLP中必不可少的語料資源web jieba分詞模塊參考官方文檔啦~算法 # 參照代碼中的cutWords.py文件 二、利用卡方檢驗特徵選擇svg 卡方檢驗:在構建每一個類別的詞向量後,對每一類的每個單詞進行其卡方統計
相關文章
相關標籤/搜索