粗讀CVPR2019 論文 Transfer Learning via Unsupervised Task Discovery for Visual Question Answering

聲明:本文爲個人觀點,如有不同意見,希望評論區指出,共同進步。 文章解決的問題 現有的大批量的視覺數據集,標籤,區域選擇邊框爲在圖像中學習豐富的可表達信息提供了一定的基礎。但是,如何將視覺概念給抽取出來並且傳給一個視覺相關問題,並由一個問題回答模型給出這個問題的答案依然是當前要解決的一個點。我們稱這類問題的總稱叫做visual question answering (VQA)。 文章中的做法 作者
相關文章
相關標籤/搜索