UCAS - AI學院 - 自然語言處理專項課 - 第12講 - 課程筆記

文本分類與聚類 文本分類 文本——領域信息分類 傳統機器學習方法 文本表示 向量空間模型——BoW模型 詞的權重 詞頻TF 布爾變量 逆文檔頻率IDF TF-IDF 特徵選擇 文檔頻率:根據訓練語料中的文檔頻率,對所有特徵進行排序 詞頻:根據訓練語料中特徵的頻率,對所有特徵進行排序 基於無監督思想,特徵選擇缺乏類別信息的指導 相關概率估計(文檔數) P ( c j ) ≈ ( A i j + C
相關文章
相關標籤/搜索