《iVQA: Inverse Visual Question Answering》逆向視覺問答論文理解

下面是我對最近看的逆向視覺問答文章的理解 一、文章摘要 我們提出了視覺問題回答(iVQA)的反問題,並探 討了其是否適合作爲視覺語言理解的基準.iVQA任務是生成一個與給定圖像和答案對對應的問題。由於答案的信息量低於問題,而且問題具有較少的可學習偏差,因此iVQA模型需要比VQA模型更好地理解圖像才能成功。我們將問題生成作爲一種多模式動態推理過程,並提出一個 iVQA 模型,該模型可以逐漸調整其關
相關文章
相關標籤/搜索