利用TFIDF策略和樸素貝葉斯算法進行中文文本分類

以前作了一個簡單的中文文本分類系統,採用的是樸素貝葉斯的算法,如今回顧一下並詳細給出每個步驟。如有源代碼需求,請移步 https://github.com/chenfei0328/BayesProjectgit 1、文本預處理github 1.格式問題,好比刪空格,刪換行符等。 2.jieba分詞 https://github.com/fxsjy/jiebaweb 2、創建向量空間模型算法 1.加
相關文章
相關標籤/搜索