QA(三): 複雜attention機制(coattention及bi-attention)

DCN-動態共同attention網絡 兩種模型都是類似的,不像前一篇文章介紹的soft attention機制,只是考慮query到context的attention 這裏兩篇論文都會考慮 query 到 context 和 context到query的attention 然後得到的attention回和原始的encoder向量進行作用,得到修正後的query和context的修正矩陣 然後這些
相關文章
相關標籤/搜索