視覺場景理解論文閱讀筆記:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

一、文章相關資料 1.論文地址:點擊打開鏈接 2.論文代碼:點擊打開鏈接 3.發表時間:2018 二、閱讀筆記 1.論文思想         文章提出一種自上而下與自下而上相結合的注意力模型方法,應用於視覺場景理解和視覺問答系統的相關問題。其中基於自下而上的關注模型(一般使用Faster R-CNN)用於提取圖像中的興趣區域,獲取對象特徵;而基於自上而下的注意力模型用於學習特徵所對應的權重(一般使
相關文章
相關標籤/搜索