自然語言處理(五 文本相似度)

簡單共有詞判斷模型 TFIDF向量表示 TFIDFWord2vec LMSentence Embedding表示 簡單共有詞判斷模型 假設現在有文本A和B, Num(A∩B) 表示A和B中相同詞的數量, Num(A∪B) 表示A和B中所有詞的數量。那麼定義A和B的相似程度爲: Similarity(A,B)=Num(A∩B)Num(A∪B) TFIDF向量表示 上述共有詞方式,只利用了詞語的信息,
相關文章
相關標籤/搜索