第7-1課:餘弦相似度與相似算法(圖文篇)

相似度算法是計算個體之間相似程度的算法,此類算法多如牛毛,這裏我們只討論用於處理文字之間相似度的算法。文本之間的相似度計算應用廣泛,比如論文抄襲的判斷,就可以用相似度算法先預篩查一遍;再比如網站的文章自動分類,就是根據相似度將文章自動分入科技、體育、軍事等類別中。此外,廣告推送、訂單識別等場合,也會用到文本相似度的判斷。 餘弦相似度(餘弦距離) 通常用於判斷相似度的理論有很多,比如歐氏距離、餘弦相
相關文章
相關標籤/搜索