自然語言處理第一番之文本分類器

前言 文本分類應該是自然語言處理中最普遍的一個應用,例如文章自動分類、郵件自動分類、垃圾郵件識別、用戶情感分類等等,在生活中有很多例子,這篇文章主要從傳統和深度學習兩塊來解釋下我們如何做一個文本分類器。 文本分類方法 傳統的文本方法的主要流程是人工設計一些特徵,從原始文檔中提取特徵,然後指定分類器如LR、SVM,訓練模型對文章進行分類,比較經典的特徵提取方法如頻次法、tf-idf、互信息方法、N-
相關文章
相關標籤/搜索