詞向量模型(1)

詞向量模型 one-hot Vector one-hot vector 最簡單的編碼方式:假設我們的詞庫總共有n個詞,那我們開一個1*n的高維向量,而每個詞都會在某個索引index下取到1,其餘位置全部都取值爲0。 問題 這種詞向量編碼方式簡單粗暴,我們將每一個詞作爲一個完全獨立的個體來表達。遺憾的是,這種方式下,我們的詞向量沒辦法給我們任何形式的詞組相似性權衡。因爲你開了一個極高維度的空間,然後
相關文章
相關標籤/搜索