論文解讀:Dual Attention Networks for Multimodal Reasoning and Matching

這是關於VQA問題的第八篇系列文章。本篇文章將介紹論文:主要思想;模型方法;主要貢獻。有興趣可以查看原文:Dual Attention Networks for Multimodal Reasoning and Matching 1,主要思想: 這篇文章依然從多模態推理上介紹,不同的是文章引入兩種類型的DANs進行多模態推理,匹配以及分類。 推理模型允許可視化並在協作推理期間用文本注意機制互相關聯
相關文章
相關標籤/搜索