常見的語言表示模型(詞嵌入、句表示、篇章表示)

語言表示方法大體上可以從兩個維度進行區分。一個維度是按不同粒度進行劃分,語言具有一定的層次結構,語言表示可以分爲字、詞、句子、篇章等不同粒度的表示。另一個維度是按表示形式進行劃分,可以分爲離散表示和連續表示兩類。離散表示是將語言看成離散的符號,而將語言表示爲連續空間中的一個點,包括分佈式表示和分散式表示。 一、離散表示 1、詞向量 一個詞可以表示爲One-Hot 向量(一維爲1 其餘維爲0 的向量
相關文章
相關標籤/搜索