文本相似度計算綜述

概述 在信息爆炸時代,人們迫切希望從海量信息中獲取與自身需要和興趣吻合度高的內容,爲了滿足此需求,出現了多種技術,如:搜索引擎、推薦系統、問答系統、文檔分類與聚類、文獻查重等,而這些應用場景的關鍵技術之一就是文本相似度計算技術。因此瞭解文本相似度的計算方法是很有必要的。 文本相似度定義 文本相似度在不同領域被廣泛討論,由於應用場景不同,其內涵有所差異,故沒有統一、公認的定義。 Lin從信息論的角度
相關文章
相關標籤/搜索