tf-idf關鍵詞提取算法

tf-idf簡介 在信息提取的應用場景之中,咱們每每須要一些文本中的重要的詞而不是文本中的全部詞語來進行分析,即便原文本已經進行了去停用詞的處理。 那麼什麼樣的詞算是文本中的關鍵詞呢?一方面,這個詞應該在文本中出現的次數比較多;另外一方面,這個詞應該不那麼常見,如果這個詞在不少文檔中都有出現,這個詞顯然不能用來做爲表明某個文檔的重要詞彙。一個合適的算法即是tf-idf算法。 tf-idf是term
相關文章
相關標籤/搜索