Visual Reasoning | GQA Dataset

參考博客: https://blog.csdn.net/hester_hester/article/details/103238649 https://zhuanlan.zhihu.com/p/64183181 CLEVR雖然消除了dataset bias,但是人工合成的圖像和問題組成,多樣性較低,類和屬性較少,容易使模型記住所有組合。 因此提出GQA,由真實圖像組成,並在一個大的語義空間中運行,
相關文章
相關標籤/搜索