文本分類項目總結

摘抄:https://zhuanlan.zhihu.com/p/25928551(原文地址) 一.傳統文本分類 1)文本預處理 文本預處理過程是在文本中提取關鍵詞表示文本的過程,中文文本處理中主要包括文本分詞和去停用詞兩個階段。 2)文本表示和特徵提取 文本表示: 傳統做法常用詞袋模型(BOW, Bag Of Words)或向量空間模型(Vector Space Model),最大的不足是忽略文本
相關文章
相關標籤/搜索