Don’t Just Assume; Look and Answer:Overcoming Priors for Visual Question Answering閱讀筆記

許多研究發現,目前的視覺問題回答(VQA)模型在很大程度上是由訓練數據的表面相關性驅動的,缺乏足夠的圖像基礎。我們提出了一種新的VQA設置,即針對每種題型,訓練和測試集都有不同的答案先驗分佈。提出了VQA v1和VQA v2數據集的新分割,稱之爲改變先驗下的可視化問題回答(VQA-CP v1和VQA-CP v2)。 1、文章引入 先前的工作所研究的模型當面對一個困難的學習問題時,通常訴諸於鎖定訓練
相關文章
相關標籤/搜索