NLP中關鍵詞的提取

一:關鍵詞提取的方法有多種,分別如下: TF-IDF、主題模型、TestRank、rake 二:首先來說一下TF-IDF: TF是詞頻,IDF是逆向文件頻率,IDF起到給詞賦予權重的作用。 TF-IDF的思想:重要的詞一定在文章中出現多次,但同時在各個文章中出現多次的詞一定沒有在只在同一篇文章中出現多次的詞的重要性大。 此方法類似統計方法,下面把計算方法列舉出來: TF=某個詞在文章出現的次數/文
相關文章
相關標籤/搜索