論文筆記 Visual Question Answering with Memory-Augmented Networks(CVPR2018)

這是沈春華老師小組的一篇文章。 這篇文章的出發點是:目前的VQA問題,由於answer數量的有限性,因此轉化爲一種分類問題,但由於部分answer出現 的頻次較低(比如上圖中的黃瓜),爲了提高整體的分類準確率,往往進行分類的時候,將頻次低的answer進行捨棄, 如取answer出現頻次高的top1000,。基於這種現象,本文提出Memory-Augmented Network來處理這樣一種長尾效
相關文章
相關標籤/搜索