關於word2vec 句子相似度計算

時間 2020-12-30

標籤 word2vec 句子之間相似度欄目 Microsoft Office 简体版

原文原文鏈接

在生成詞向量之後，基於詞向量計算句子相似度： 1.首先處理句子的重點詞彙，排除無關詞彙，比如我你他之類的，non_words.txt裏面是一些無關詞彙 2.接下來根據相關的處理結果，做一個單項匹配首先根據s1的句子，找到是s1中第一個詞語的在第二句話中的最大相似值，再依次找到第二個，第三個，取平均值作爲s1 ->s2句子的單項匹配 3.最後取雙向匹配的平均值作爲 s1 和 s2 的句

>>阅读原文<<