文本特徵選擇之互信息和卡方

參考:http://www.cnblogs.com/fengfenggirl/p/text_feature_selection.htmlhtml 在作文本挖掘,特別是有監督的學習時,經常須要從文本中提取特徵,提取出對學習有價值的分類,而不是把全部的詞都用上,所以一些詞對分類的做用不大,好比「的、是、在、了」等停用詞。這裏介紹兩種經常使用的特徵選擇方法:學習 互信息atom   一個經常使用的方法是
相關文章
相關標籤/搜索