吳恩達深度學習第五章序列模型——第二週自然語言處理與詞嵌入

詞嵌入 one-hot 向量將每個單詞表示爲完全獨立的個體,不同詞向量都是正交的,因此單詞間的相似度無法體現。 換用特徵化表示方法能夠解決這一問題。我們可以通過用語義特徵作爲維度來表示一個詞,因此語義相近的詞,其詞向量也相近。 將高維的詞嵌入「嵌入」到一個二維空間裏,就可以進行可視化。常用的一種可視化算法是 t-SNE 算法。在通過複雜而非線性的方法映射到二維空間後,每個詞會根據語義和相關程度聚在
相關文章
相關標籤/搜索