Word2Vec的原理與實現

詞向量表達 word2vec就是將單詞嵌入到向量空間中。 獨熱表達: 每一個單詞用不同的ID進行表示,因此可以表示爲其中一個維度爲1,其他全0的向量。例如: 科學院:[1,0,0] 中科院:[0,1,0] 數據挖掘:[0,0,1] 此種方法相當於將單詞看成無語義的ID。在向量空間中考慮,此時單詞之間相似性程度一樣,不能體現出單詞間的語義關係。 分佈式表達 每一個單詞表示爲一般的向量,可以建模單詞之
相關文章
相關標籤/搜索