【面試】文本分類

文本分類問題Pipeline 基本上機器學習和深度學習對於文本分類的pipeline都是上圖這個流程。區別: 機器學習提取的是具體特徵,如TF-IDF,BOW 深度學習提取的是抽象特徵,如詞向量 傳統的分類器在NLP競賽中都不太好用了,所以基本現在都用深度學習。 最重要的兩個步驟: 1.數據轉化爲信息,即文本表示工作,可以理解爲詞向量訓練 2.信息轉化爲知識,即做好分類器,可以理解爲模型設計 文本
相關文章
相關標籤/搜索