中文文本分類大概的步驟

文本分類問題:給定文檔p(可能含有標題t),將文檔分類爲n個類別中的一個或多個 文本分類應用:常見的有垃圾郵件識別,情感分析 文本分類方向:主要有二分類,多分類,多標籤分類 文本分類方法:傳統機器學習方法(貝葉斯,svm等),深度學習方法(fastText,TextCNN等) 文本分類的處理大致分爲文本預處理、文本特徵提取、分類模型構建等。和英文文本處理分類相比,中文文本的預處理是關鍵技術。  
相關文章
相關標籤/搜索