NLP——12.詞向量及相關應用

表示人類造出的詞: (1)從語料中提取出含義表達。 (2)從文字到數值向量 詞編碼的方式:N-gram,TF-IDF——Word2vec(對於多義詞會轉化到同一個數值向量,從而導致不準確)——sense2vec(區分在不同語境下某些單詞的具體含義) · 給每個詞一個索引,每個詞都編碼一個下標,但是由於詞與詞之間有一些隱含的關係,這樣做會破壞這個關係。近義詞,同一類。 繪製到一個二維空間中,希望保證
相關文章
相關標籤/搜索