自然語言處理之文本相似度

1、文本相似度: 1) 語義相似、但字面不相似 2) 字面相似、但是語義不相似 2、方案: 1) 語義相似:依靠用戶行爲,最基本的方法:(1)基於共點擊的行爲(協同過濾),(2)藉助迴歸算法 2) 字面相似:(1) LCS最大公共子序列 (2) 利用中文分詞 3 字面相似的問題解決:        餘弦相似度 cosine                     舉例:A(1,2,3),B(2,3
相關文章
相關標籤/搜索