文本相似度算法總結

文本匹配算法主要用於搜索引擎,問答系統等,是爲了找到與目標文本最相關的文本。例如信息檢索可以歸結成查詢項和文檔的匹配,問答系統可以歸結爲問題和候選答案的匹配,對話系統可以歸結爲對話和回覆的匹配。 一、傳統模型 基於字面匹配 字面距離:字符串有字符構成,只要比較兩個字符串中每一個字符是否相等便知道兩個字符串是否相等,或者更簡單一點將每一個字符串通過哈希函數映射爲一個哈希值,然後進行比較。 主要方法:
相關文章
相關標籤/搜索