《Dense Passage Retrieval for Open-Domain Question Answering》論文閱讀

1、摘要   開放域問題回答依賴於高效的文本檢索來選擇候選段落,傳統的稀疏向量空間模型用的較多的有TF-IDF 或 BM25算法,但這些算法僅僅是在詞的匹配上進行檢索,並未考慮語義的相關性,有很大的侷限性。因此,論文提出了一種新的算法來檢索候選段落,稱之爲:DPR算法。DPR算法在 top-20段落文本檢索準確率方面比 Lucene-BM25系統高出9%-19% ,這非常有利於後續的QA任務的性能
相關文章
相關標籤/搜索