貝葉斯文本分類 java實現

昨天實現了一個基於貝葉斯定理的的文本分類,貝葉斯定理假設特徵屬性(在文本中就是詞彙)對待分類項的影響都是獨立的,道理比較簡單,在中文分類系統中,分類的準確性與分詞系統的好壞有很大的關係,這段代碼也是試驗不一樣分詞系統才順手寫的一個。 試驗數據用的sogou實驗室的文本分類樣本,一共分爲9個類別,每一個類別文件夾下大約有2000篇文章。因爲文本數據量確實較大,因此得想辦法讓每次訓練的結果都能保存起來
相關文章
相關標籤/搜索