文本類似度計算(二):hash方法

文本類似度計算 BooI模型 tf-idf模型(增長詞權重特徵) BM25 模型(增長了長度特徵) Proximity 模型(增長了位置特徵) 語義特徵模型(增長了 Topic特徵) 句法特徵模型(增長了句法特徵) 深度表示模型(增長語義特徵) 這一篇都是參考(抄)《文本上的算法》(路彥雄) Hash 方法主要有 minhash 和 simhash。 minhash 的主要目的是降維,它的主要原理
相關文章
相關標籤/搜索