從單詞嵌入到文檔距離 :WMD一種有效的文檔分類方法

文檔分類和文檔檢索已顯示出廣泛的應用。 文檔分類的重要部分是正確生成文檔表示。 馬特·庫斯納(Matt J. Kusner)等人在2015年提出了Word Mover’s Distance(WMD)[1],其中將詞嵌入技術用於計算兩個文檔之間的距離。 使用給定的預訓練單詞嵌入,可以通過計算「一個文檔的嵌入單詞需要「移動」以到達另一文檔的嵌入單詞所需的最小距離」來用語義含義來度量文檔之間的差異。 在
相關文章
相關標籤/搜索