elasticsearch的TF/IDF打分公式總結

elasticsearch的TF/IDF打分公式 NLP中的TF/IDF TF TF(term frequency)這個數字是對詞數(term count)的歸一化,以防止它偏向長的文件。 IDF 逆向文件頻率(inverse document frequency,IDF)是一個詞語普遍重要性的度量。某一特定詞語的IDF,可以由總文件數目除以包含該詞語之文件的數目,再將得到的商取對數得到: es是
相關文章
相關標籤/搜索