BM25理解

BM25算法是一種用於評價搜索詞與文檔之間相關性的算法,他是一種基於概率檢索模型提出的算法。基本思想:我們現在有一個query和一批文檔docs,現在要計算query和每一篇文檔的doc之間的相關性分數,我們的做法就是,先對query進行切分,得到單詞分數,其中單詞分數由三部分組成: l 單詞和query之間的相關性 l 單詞和doc之間的相關性 l 單詞本身的權重 最後對於每一個單詞的分數做一個
相關文章
相關標籤/搜索