詞的數字化表示方法和詞嵌入

獨熱編碼無法理解同義詞之間的相關性 相關性通過詞嵌入解決 通常就像遷移學習一樣,用別人訓練好的來進行詞嵌入。自己訓練要較好的 如果想要中文問本可以取最後一個 先用具體數字代表數字,只是離散的id號,如果用這種id做特徵向量不利於做相似度計算。詞編變成了詞索引向量,利用詞嵌入技術,轉爲四維向量
相關文章
相關標籤/搜索