跨模態檢索CM-GANs: Cross-modal Generative AdversarialNetworks for Common Representation Learning

時間 2021-07-13

原文原文鏈接

核心思想：這篇論文主要是通過對抗訓練文本和圖像，是它們學習到共同的特徵表示。本論文由四個對抗訓練過程組成（詳細看損失函數）。圖像自身的對抗網絡，文本自身的對抗網絡，圖像對文本的對抗網絡、文本對圖像的對抗網絡。圖像自身的對抗網絡：通過圖像卷積學習到到特徵向量（不是最終的特徵表示，論文中爲hi），作爲真實數據，重建（也就是decode過程）的特徵向量(論文中爲ri)作爲假數據，來構建對抗網

>>阅读原文<<