CS224n課程筆記(二)——詞向量表示:word2vec

一、詞義表示 在計算機中,我們如何去表示一個單詞呢?在傳統的NLP算法中,我們將單詞表示爲離散的符號,那麼這些單詞就可以用one-hot向量來表示。在向量的某一位置爲1,其餘位置爲0。這樣的向量會非常長。 那麼這樣表示的問題在於它沒有給出詞彙之間的內在關係。單詞向量之間是互相垂直的,我們沒有辦法計算它們之間的相似性。 那麼我們要怎麼做呢?這裏我們要用到NLP中一個概念:分佈相似性。分佈相似性就是指
相關文章
相關標籤/搜索