文本轉化爲向量

假如有一句話"I am a student"。用向量來表示每個單詞,採用one hot 編碼表示方式: I -> [1,0,0,0] am -> [0,1,0,0] a -> [0,0,1,0] student -> [0,0,0,1] 我們會發現兩個缺點: (1)單詞向量之間的內積爲0,它們相互獨立。這與實際情況是矛盾的,單詞之間是有一定的聯繫,比如woman與girl,dog與dogs。 (2
相關文章
相關標籤/搜索