文本分類概論

思路歷程: 1.利用知識工程建立專家系統進行分類 通過添加特定規則做分類任務,費時費力,覆蓋的範圍和準確率都非常有限。 2.人工特徵工程+淺層分類模型 文本預處理:在文本中提取關鍵詞表示文本 中文文本預處理主要包括 分詞 jieba等工具,具體算法參考相關文章 去停用詞 維護停用詞表(包括高頻的代詞連詞介詞等),特徵提取過程中刪除停用表中出現的詞等 文本表示 1.詞袋模型(one-hot編碼) 缺
相關文章
相關標籤/搜索