Word2Vec筆記

NLP 中最直觀,也是到目前爲止最常用的詞表示方法是 One-hot Representation,這種方法把每個詞表示爲一個很長的向量。從很大的詞庫corpus裏選V個頻率最高的詞(忽略其他的) ,V一般比較大,比如V=10W,固定這些詞的順序,然後每個詞就可以用一個V維的稀疏向量表示了,這個向量只有一個位置的元素是1,其他位置的元素都是0。這個向量的維度是詞表大小,其中絕大多數元素爲 0,只有
相關文章
相關標籤/搜索