訓練數據對分類器性能的影響

之前一個朋友託我試驗一下訓練數據的不平衡性對分類器會有多大影響,他所用的分類器是支持向量機(SVM),用來做文本分類。這本身是一個已經研究得比較多的領域了,也已經有比較成熟甚至可以直接在生產中使用的工具(比如這裏要用的 LIBSVM)了。當然分類器是由訓練數據訓練出來的模型,所以訓練數據肯定會對其造成直接的影響,這裏所說的不平衡性就是各個類別的訓練 sample 數目不平衡,比如,在二元分類的情況
相關文章
相關標籤/搜索