image caption筆記（九）：《Unsupervised Image Captioning》

時間 2020-12-20

原文原文鏈接

無監督的caption 文章使用一個圖像數據集（MSCOCO）和一個文本語料庫（從Web上抓取的200多萬個句子組成圖像描述語料庫）來做無監督caption。沒有任何配對集合。 1、模型結構：提出的圖像字幕模型由圖像編碼器（沒有用VGG 和resnet，改用了Inception v4），句子生成器和句子鑑別器組成。訓練目標包括了三部分：（1）使用語料庫來訓練一個CGAN網絡，cond

>>阅读原文<<