文本分類的相關知識

本文章並非完全自己的思想,都是近來所看加總結,記錄下來加深自己的理解。 文本分類流程圖 特徵提取 特徵提取=特徵項的選擇+特徵權重的計算。 特徵項的選擇:根據某個評價指標,獨立的對原始特徵項(詞語)進行評分排序,從中選取一些評分最高的特徵項,過濾掉其餘的特徵項。 特徵權重的計算:依據一個詞的重要程度,與類別內的詞頻成正比(代表性),與所有類別中出現的次數成反比(區分度)。 當選用數學方法進行特徵提
相關文章
相關標籤/搜索