文本分類學習(六) AdaBoost和SVM

直接從特徵提取,跳到了BoostSVM,是因爲自己一直在寫程序,分析垃圾文本,和思考文本分類用於識別垃圾文本的短處。自己學習文本分類就是爲了識別垃圾文本。 中間的博客待自己研究透徹後再補上吧。   因爲獲取垃圾文本的時候,發現垃圾文本不是簡單的垃圾文本,它們具有多個特性: 1. 種類繁多,難有共同的特徵。涵蓋各行各業的廣告,或者政治敏感內容,或者色情信息。不像對文本分類那樣,屬於一類的文本,他們的
相關文章
相關標籤/搜索