《Stacked Attention Networks for Image Question Answering》論文閱讀

《Stacked Attention Networks for Image Question Answering》論文閱讀 摘要 本文介紹了堆疊注意力網絡(SANs),它學習從圖像中回答自然語言問題,San使用問題的語義表示作爲查詢來搜索圖像中與答案相關的區域,通過多次查詢一個映像,在四個圖像質量保證數據集上進行的實驗表明,該方法明顯優於以往的先進方法。 一、介紹 圖像中有幾個物體:自行車、窗戶、
相關文章
相關標籤/搜索