餘弦相似度

在推薦系統中,對於文章內容和物品相似度有多種算法可以使用,而餘弦相似度算法相對簡單並且準確性也不錯,因此使用率比較高。 定義: 餘弦相似度用向量空間中兩個向量夾角的餘弦值作爲衡量兩個個體間差異的大小。餘弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似,這就叫"餘弦相似性"。 通過計算兩個向量之間的夾角來衡量兩個向量的相似度,角度越小說明相似度越高。 在向量表示的三角形中,假設a向量是(x1
相關文章
相關標籤/搜索