搜索引擎相關度算法 -BM25 JAVA實現

bm25 是一種用來評價搜索詞和文檔之間相關性的算法,它是一種基於機率檢索模型提出的算法。html 它的出現主要是解決TF-IDF算法中 TF的影響可無限增大的不足,本質上 BM25是基於TF-IDF並作了改進的算法。java 如圖所示,傳統的TF-IDF算法中 詞頻的影響程度是無限增大的,換而言之就是關鍵詞出現的越頻繁,TF-IDF相關度就越高。稍微有點簡單粗暴;而BM25算法就是讓詞頻的影響到
相關文章
相關標籤/搜索