Multi-level Attention Networks for Visual Question Answering閱讀筆記

時間 2021-01-04

原文原文鏈接

Multi-level Attention Networks 這個模型可以同時提取高級語義信息和空間信息，模型框架如下所示：該模型分爲三個部分，分別是Semantic Attention、Context-aware Visual Attention、Joint Attention Learning。 Semantic Attention 語義注意的工作是從圖像中挖掘重要的概念來回答問題。雖然概念

>>阅读原文<<