TF-IDF與餘弦相似性的應用(二):找出相似文章(轉)

作者: 阮一峯 日期: 2013年3月21日 上一次,我用TF-IDF算法自動提取關鍵詞。 今天,我們再來研究另一個相關的問題。有些時候,除了找到關鍵詞,我們還希望找到與原文章相似的其他文章。比如,"Google新聞"在主新聞下方,還提供多條相似的新聞。 爲了找出相似的文章,需要用到"餘弦相似性"(cosine similiarity)。下面,我舉一個例子來說明,什麼是"餘弦相似性"。 爲了簡單起
相關文章
相關標籤/搜索