論文解讀:From Pixels to Objects: Cubic Visual Attention for Visual Question Answering

這是關於VQA問題的第十一篇系列文章。本篇文章將介紹論文:主要思想;模型方法;主要貢獻。有興趣可以查看原文:From Pixels to Objects: Cubic Visual Attention for Visual Question Answering 1,主要思想 作者提出一般的Spatial visual attention只是選出了最關注的視覺對象,在通道上採用的相同的權重,這不符合
相關文章
相關標籤/搜索