關鍵詞提取(tf-idf與textRank)

關鍵詞提取(tf-idf與textRank) 一.tf-idf tf-idf提取關鍵詞是一種簡單有效的提取關鍵詞的方法.其思想主要在於預先統計在語料中出現的所有詞的詞頻,計算出idf值,然後再針對要提取關鍵詞的文章或句子的每個詞計算出tf值,乘起來便是tf-idf值.值越大表示作爲關鍵詞的優先級越高. 假設現在語料一共有M篇文章,其中詞A在其中m篇中出現過了,那麼A的idf值爲 log(M/m)
相關文章
相關標籤/搜索