文檔的詞頻-反向文檔頻率(TF-IDF)計算

TF-IDF計算:java TF-IDF反映了在文檔集合中一個單詞對一個文檔的重要性,常常在文本數據挖據與信息ide 提取中用來做爲權重因子。在一份給定的文件裏,詞頻(termfrequency-TF)指的是某一spa 個給定的詞語在該文件中出現的頻率。逆向文件頻率(inversedocument frequency,.net IDF)是一個詞語普遍重要性的度量。某一特定詞語的IDF,能夠由總文件
相關文章
相關標籤/搜索