系統學習NLP(十二)--文本表示綜述

文本表示,簡單的說就是不將文本視爲字符串,而視爲在數學上處理起來更爲方便的向量(也就是文本特徵抽取)。而怎麼把字符串變爲向量,就是文本表示的核心問題。 文本表示,基於類型分爲: 長文本表示 短文本表示(句子) 詞表示 關於文本表示,研究者從不同的角度出發,提出大量的文本表示模型。本文重點梳理現有模型,大致分爲三類,即基於向量空間模型、基於主題模型和基於神經網絡的方法。 基於向量空間模型的方法 向量
相關文章
相關標籤/搜索