nlp閱讀理解比賽經驗貼

(一)比賽類型 多篇章閱讀理解 篇章長度長 問題有多跳類型 沒有yes no類型 (一)數據預處理 1、blue、rouge、f1、tfidf、bm25進行相似度度量 2、採用前1000字、與問題最相似的幾句話的策略,效果都不好,只能達到76%的覆蓋率 3、用相似度進行排序,將1-3個句子的前一句後兩句,4-6個句子前一句後一句,7-10個句子本身,覆蓋率提升到95%,平均長度1600,後期優化到
相關文章
相關標籤/搜索