自然語言處理（五文本相似度）

時間 2020-12-24

標籤自然語言處理简体版

原文原文鏈接

簡單共有詞判斷模型 TFIDF向量表示 TFIDFWord2vec LMSentence Embedding表示簡單共有詞判斷模型假設現在有文本A和B， Num(A∩B) 表示A和B中相同詞的數量， Num(A∪B) 表示A和B中所有詞的數量。那麼定義A和B的相似程度爲： Similarity(A,B)=Num(A∩B)Num(A∪B) TFIDF向量表示上述共有詞方式，只利用了詞語的信息，

>>阅读原文<<