MUREL: Multimodal Relational Reasoning for Visual Question Answering筆記

一、論文信息 論文地址:https://arxiv.org/abs/1902.09487 代碼地址:github.com/Cadene/ murel.bootstrap.pytorch 二、論文模型 2.1 預處理部分         這篇文章沒有具體說明預處理的部分,但是看模型框架圖可以發現,處理視覺特徵使用的是Faster-RCNN,處理問題特徵使用的是GRU。然後得到N個dv維的image
相關文章
相關標籤/搜索