天然語言處理-搜索中經常使用的bm25

BM25算法是一種常見用來作相關度打分的公式,思路比較簡單,主要就是計算一個query裏面全部詞和文檔的相關度,而後在把分數作累加操做,而每一個詞的相關度分數主要仍是受到tf/idf的影響。web 關於Bim BIM(二元假設模型)對於單詞特徵,只考慮單詞是否在doc中出現過,並無考慮單詞自己的相關特徵,BM25在BIM的基礎上引入單詞在查詢中的權值,單詞在doc中的權值,以及一些經驗參數,因此B
相關文章
相關標籤/搜索