視覺場景理解論文閱讀筆記:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

時間 2020-12-30

原文原文鏈接

一、文章相關資料 1.論文地址:點擊打開鏈接 2.論文代碼:點擊打開鏈接 3.發表時間:2018 二、閱讀筆記 1.論文思想文章提出一種自上而下與自下而上相結合的注意力模型方法，應用於視覺場景理解和視覺問答系統的相關問題。其中基於自下而上的關注模型（一般使用Faster R-CNN）用於提取圖像中的興趣區域，獲取對象特徵；而基於自上而下的注意力模型用於學習特徵所對應的權重（一般使