論文淺嘗 - CVPR2020 | 基於網格特徵的可視問答系統

論文筆記整理:李爽,天津大學。 鏈接:https://arxiv.org/pdf/2001.03615v1.pdf 動機 隨着「自下而上」注意力的普及,基於邊界框(或區域)的視覺特徵最近已經超越了傳統的基於網格的卷積特徵,成爲視覺和語言任務的事實標準。然而,目前尚不清楚區域優勢是否是自下而上的注意力成功的關鍵原因。作者重新審視了用於VQA的網格特性,發現它們的性能令人驚訝——在同樣的精度下,運行速
相關文章
相關標籤/搜索