《GQA:現實世界中的視覺推理》數據集介紹

此篇文章簡單介紹了GQA數據集,是用於視覺問答的數據集,論文詳細,PPT介紹,如有不如,歡迎大家交流。 GQA—關於圖像場景下的問答數據集。這是一個新的數據集,將被用於對現實世界中的圖像進行視覺推理與組合回答的任務中。該數據集中包括了有關各種日常圖像的近2000萬條問題。每個圖像都與一組場景圖(scene graph)對應。每個問題都與其語義的結構化表示相關聯在一起,並且約束應答者必須採用特定的推
相關文章
相關標籤/搜索