《Dual Attention Networks for Multimodal Reasoning and Matching》

Dual Attention Networks for Multimodal Reasoning and Matching CVPR 2017 圖文匹配終極問題是整個Text與整個Image的匹配問題,但是這個問題比較難以解決,所以一個最基本的想法就是把這個問題拆分開來,Text由不同的單詞構成,Image由不同的區域構成,如果能把Text的單詞與Image的區域進行一個匹配,那麼這個問題就會變得
相關文章
相關標籤/搜索