論文解讀：From Pixels to Objects: Cubic Visual Attention for Visual Question Answering

時間 2020-12-25

原文原文鏈接

這是關於VQA問題的第十一篇系列文章。本篇文章將介紹論文：主要思想；模型方法；主要貢獻。有興趣可以查看原文：From Pixels to Objects: Cubic Visual Attention for Visual Question Answering 1，主要思想作者提出一般的Spatial visual attention只是選出了最關注的視覺對象，在通道上採用的相同的權重，這不符合

>>阅读原文<<