Multi-level Attention Networks for Visual Question Answering閱讀筆記

Multi-level Attention Networks 這個模型可以同時提取高級語義信息和空間信息,模型框架如下所示: 該模型分爲三個部分,分別是Semantic Attention、Context-aware Visual Attention、Joint Attention Learning。 Semantic Attention 語義注意的工作是從圖像中挖掘重要的概念來回答問題。雖然概念
相關文章
相關標籤/搜索