用於視覺問答的基於關係推理和注意力的多峯特徵融合模型《Multimodal feature fusion by relational reasoning and attention for VQA》

時間 2020-12-30

原文原文鏈接

目錄一、文獻摘要介紹二、網絡框架介紹三、實驗分析四、結論這是視覺問答論文閱讀的系列筆記之一，本文有點長，請耐心閱讀，定會有收貨。如有不足，隨時歡迎交流和探討。一、文獻摘要介紹 The recently emerged research of Visual Question Answering (VQA) has become a hot topic in computer vision

>>阅读原文<<