Visual Question Answering with Memory-Augmented Networks閱讀心得

本文中利用記憶增強神經網絡來預測視覺問題的準確答案,即使這些答案很少出現在訓練集中。記憶網絡結合了內部和外部記憶塊,並有選擇地關注每個訓練範例。證明了在答案重尾分佈的VQA環境中,記憶增強神經網絡能夠保持對稀缺訓練樣本的相對長期記憶。 一、文章引入 現有的VQA系統訓練深度神經網絡存在的兩個問題: 1)首先,使用基於梯度的方法訓練的深度模型學會響應大多數訓練數據,而不是特定的稀缺樣本。然而,在自然
相關文章
相關標籤/搜索