論文淺嘗 - IJCAI2020 | Mucko:基於事實的多層跨模態知識推理視覺問答

論文筆記整理:陳卓,浙江大學計算機科學與技術系,博士研究生。 論文鏈接:https://arxiv.org/pdf/2006.09073 代碼:https://github.com/astro-zihao/mucko 發表會議:IJCAI 2020 任務定義及背景 VQA(視覺問答)顧名思義,也就是結合視覺的信息來回答問題。其於15年被提出,涉及的方法從最開始的聯合編碼,到雙線性融合,注意力機制,
相關文章
相關標籤/搜索