TF-IDF與餘弦相似性的應用(二):找出相似文章

轉自:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 上一次,我用 TF-IDF 算法自動提取關鍵詞。 今天,我們再來研究另一個相關的問題。有些時候,除了找到關鍵詞,我們還希望找到與原文章相似的其他文章。比如,」Google 新聞」在主新聞下方,還提供多條相似的新聞。 爲了找出相似的文章,需要用到「餘弦相似性」(cosin
相關文章
相關標籤/搜索