(算法)海量文章中找出相似文章-TF-IDF與餘弦相似性的應用(二)

轉載來自:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 今天,我們再來研究另一個相關的問題。有些時候,除了找到關鍵詞,我們還希望找到與原文章相似的其他文章。比如,"Google新聞"在主新聞下方,還提供多條相似的新聞。 爲了找出相似的文章,需要用到"餘弦相似性"(cosine similiarity)。下面,我舉一個例子
相關文章
相關標籤/搜索