自動提取關鍵詞---TF-IDF原理

TF-IDF原理 寫在前面: 假如有一篇很長的文章,要用計算機提取它的關鍵詞(Automatic Keyphrase extraction),完全不加以人工干預,怎樣才能正確做到? 有一個非常簡單的算法,TF-IDF就可以很快速的解決這個問題。 一、例子講解 假定現在有一篇長文《中國的蜜蜂養殖》,需要用計算機提取它的關鍵詞。 一個容易想到的思路,就是找到出現次數最多的詞。如果某個詞很重要,它應該在
相關文章
相關標籤/搜索