餘弦相似性計算【轉】

    句子A:我喜歡看電視,不喜歡看電影。   句子B:我不喜歡看電視,也不喜歡看電影。 請問怎樣才能計算上面兩句話的相似程度? 基本思路是:如果這兩句話的用詞越相似,它們的內容就應該越相似。因此,可以從詞頻入手,計算它們的相似程度。 第一步,分詞。   句子A:我/喜歡/看/電視,不/喜歡/看/電影。   句子B:我/不/喜歡/看/電視,也/不/喜歡/看/電影。 第二步,列出所有的詞。   我
相關文章
相關標籤/搜索