文本表示

導言 文本分類是自然語言處理中研究最爲廣泛的任務之一,通過構建模型實現對文本內容進行自動分類,有很多應用場景,比如新聞文章主題分類,產品評論情感分類,檢索中用戶查詢的意圖分類等等。文本分類的大致流程:文本預處理,抽取文本特徵,構造分類器。其中研究最多的就是文本特徵抽取,更廣義上說是文本表示。 關於文本表示,研究者從不同的角度出發,提出大量的文本表示模型。本文重點梳理現有模型,大致分爲三類,即基於向
相關文章
相關標籤/搜索