跨模態檢索CM-GANs: Cross-modal Generative AdversarialNetworks for Common Representation Learning

核心思想:   這篇論文主要是通過對抗訓練文本和圖像,是它們學習到共同的特徵表示。本論文由四個對抗訓練過程組成(詳細看損失函數)。圖像自身的對抗網絡,文本自身的對抗網絡,圖像對文本的對抗網絡、文本對圖像的對抗網絡。   圖像自身的對抗網絡:通過圖像卷積學習到到特徵向量(不是最終的特徵表示,論文中爲hi),作爲真實數據,重建(也就是decode過程)的特徵向量(論文中爲ri)作爲假數據,來構建對抗網
相關文章
相關標籤/搜索