利用TFIDF策略和樸素貝葉斯算法進行中文文本分類

之前做了一個簡單的中文文本分類系統,採用的是樸素貝葉斯的算法,現在回顧一下並詳細給出每一個步驟。若有源代碼需求,請移步 https://github.com/chenfei0328/BayesProject 一、文本預處理 1.格式問題,比如刪空格,刪換行符等。 2.jieba分詞 https://github.com/fxsjy/jieba 二、建立向量空間模型 1.加載訓練集,每一篇文檔作爲一
相關文章
相關標籤/搜索