閱讀筆記(Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding)

轉載請註明出處: 西土城的搬磚工 論文鏈接: Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding 來源:EMNLP(2016) 關鍵詞:Multimodal Compact Bilinear(MCB),VQA 問題: 對於像視覺問答系統、視覺定位系統這樣Multimodal任務
相關文章
相關標籤/搜索