使用餘弦相似度算法計算文本相似度

在工作中一直使用餘弦相似度算法計算兩段文本的相似度和兩個用戶的相似度。一直弄不明白多維的餘弦相似度公式是怎麼推導來的。今天終於花費時間把公式推導出來,其實很簡單,都是高中學過的知識,只是很多年沒用了,都還給老師了。本文還通過一個例子演示如果使用餘弦相似度計算兩段文本的相似度。 餘弦函數在三角形中的計算公式爲: 在直角座標系中,向量表示的三角形的餘弦函數是怎麼樣的呢?下圖中向量a用座標(x1,y1)
相關文章
相關標籤/搜索