自然語言處理-搜索中常用的bm25

BM25算法是一種常見用來做相關度打分的公式,思路比較簡單,主要就是計算一個query裏面所有詞和文檔的相關度,然後在把分數做累加操作,而每個詞的相關度分數主要還是受到tf/idf的影響。 關於Bim BIM(二元假設模型)對於單詞特徵,只考慮單詞是否在doc中出現過,並沒有考慮單詞本身的相關特徵,BM25在BIM的基礎上引入單詞在查詢中的權值,單詞在doc中的權值,以及一些經驗參數,所以BM25
相關文章
相關標籤/搜索