數據挖掘-基於貝葉斯算法及KNN算法的newsgroup18828文本分類器的JAVA實現(上)

(update 2012.12.28 關於本項目下載及運行的常見問題 FAQ見 newsgroup18828文本分類器、文本聚類器、關聯分析頻繁模式挖掘算法的Java實現工程下載及運行FAQ )java 本文主要內容以下: 對newsgroup文檔集進行預處理,提取出30095 個特徵詞正則表達式 計算每篇文檔中的特徵詞的TF*IDF值,實現文檔向量化,在KNN算法中使用算法 用JAVA實現了KN
相關文章
相關標籤/搜索