TF-IDF與餘弦相似性的應用(一):自動提取關鍵詞

        這個問題涉及到數據挖掘、文本處理、信息檢索等很多計算機前沿領域,但是出乎意料的是,有一個非常簡單的經典算法,可以給出令人相當滿意的結果。它簡單到都不需要高等數學,普通人只用10分鐘就可以理解,這就是我今天想要介紹的TF-IDF算法。 讓我們從一個實例開始講起。假定現在有一篇長文《中國的蜜蜂養殖》,我們準備用計算機提取它的關鍵詞。          一個容易想到的思路,就是找到出現次
相關文章
相關標籤/搜索