TF-IDF與餘弦相似性的應用(二):找出相似文章

上一次,我用TF-IDF算法自動提取關鍵詞。 今天,我們再來研究另一個相關的問題。有些時候,除了找到關鍵詞,我們還希望找到與原文章相似的其他文章。比如,"Google新聞"在主新聞下方,還提供多條相似的新聞。 爲了找出相似的文章,需要用到"餘弦相似性"(cosine similiarity)。下面,我舉一個例子來說明,什麼是"餘弦相似性"。 爲了簡單起見,我們先從句子着手。   句子A:我喜歡看電
相關文章
相關標籤/搜索