關於word2vec 句子相似度計算

在生成詞向量之後,基於詞向量計算句子相似度: 1.首先處理句子的重點詞彙,排除無關詞彙,比如我你他之類的,non_words.txt裏面是一些無關詞彙 2.接下來根據相關的處理結果,做一個單項匹配    首先根據s1的句子,找到是s1中第一個詞語的在第二句話中的最大相似值,再依次找到第二個,第三個,取平均值作爲s1 ->s2句子的單項匹配    3.最後取雙向匹配的平均值作爲 s1 和 s2 的句
相關文章
相關標籤/搜索