【論文筆記09】Teaching Machines to Read and Comprehend

本文主要做出了兩個大的貢獻: 給出了閱讀理解數據集的構造方法,並開源了兩個閱讀理解數據集; 提出了三種神經網絡模型作爲baseline,以方便後面的研究者進行相關的研究。 1 數據構造 主要是從新聞網站中抓取新聞作爲文章,新聞的摘要去掉一個實體詞成爲query,被去掉的單詞作爲答案。爲了防止模型對訓練數據的過度依賴,於是將文章和問題中的實體進行匿名化和隨機替換。具體見官方教程 2 三種神經網絡模型
相關文章
相關標籤/搜索