論文筆記《Gated-Attention Readers for Text Comprehension》

來源1606.01549 這篇論文提出的模型叫做GA Reader,用的是GRU,GRU中的兩個門及候選狀態的推理公式如下: GA Reader的實現思路爲: 1,對於query首先也是用雙向GRU處理,然後分別獲取最後的狀態concate一起。 2,對於doc也是用雙向GRU處理,但是是輸出每個時刻的Hidden,最後concate在一起。 3,然後用一個K層網絡來處理,網絡第一層是1,2步處理
相關文章
相關標籤/搜索