基於svm的中文文本自動分類系統

今天剛改完成了軟件工程的大作業展示,即:基於內容的文本分類系統,使用libsvm 進行分類。在百度谷歌了很久之後,發現很少有這樣的源碼可以下載,本人便想着寫完之後上傳上去。 首先介紹一下流程: 1.先使用中科院的分詞器ICTLAS對訓練集進行分詞 2.將所有的詞構建成一個字典,以label item的形式,後面svm要用到。如:1 中國 3.提取特徵詞,由於並不是每個詞都是有用的,因此要提取出特徵
相關文章
相關標籤/搜索