信息檢索——向量空間模型(Vector Space Model)

TF:html tf 即 term frequency, 表示一個 term t 出如今 document d 中的次數,這是文檔中一個很重要的概念。出現次數更多意味着重要程度越高,可是須要注意的是,相關度的提升並非和次數的提升成同比的。所以一般tf須要作以下的處理ide w1= log10(tf+1)spa 這樣作就是要弱化次數對於相關度的影響htm DF/IDF:ci df 即 documen
相關文章
相關標籤/搜索