《Dense Passage Retrieval for Open-Domain Question Answering》論文閱讀

時間 2021-01-04

原文原文鏈接

1、摘要開放域問題回答依賴於高效的文本檢索來選擇候選段落，傳統的稀疏向量空間模型用的較多的有TF-IDF 或 BM25算法，但這些算法僅僅是在詞的匹配上進行檢索，並未考慮語義的相關性，有很大的侷限性。因此，論文提出了一種新的算法來檢索候選段落，稱之爲：DPR算法。DPR算法在 top-20段落文本檢索準確率方面比 Lucene-BM25系統高出9%-19% ，這非常有利於後續的QA任務的性能