利用TFIDF策略和樸素貝葉斯算法進行中文文本分類

時間 2021-01-01

標籤 TF-IDF算法樸素貝葉斯文本分類 python 欄目 Python 简体版

原文原文鏈接

之前做了一個簡單的中文文本分類系統，採用的是樸素貝葉斯的算法，現在回顧一下並詳細給出每一個步驟。若有源代碼需求，請移步 https://github.com/chenfei0328/BayesProject 一、文本預處理 1.格式問題，比如刪空格，刪換行符等。 2.jieba分詞 https://github.com/fxsjy/jieba 二、建立向量空間模型 1.加載訓練集，每一篇文檔作爲一

>>阅读原文<<