image caption筆記(九):《Unsupervised Image Captioning》

無監督的caption 文章使用一個圖像數據集(MSCOCO)和一個文本語料庫(從Web上抓取的200多萬個句子組成圖像描述語料庫)  來做無監督caption。沒有任何配對集合。   1、模型結構: 提出的圖像字幕模型由圖像編碼器(沒有用VGG 和resnet,改用了Inception v4),句子生成器和句子鑑別器組成。 訓練目標包括了三部分: (1)使用語料庫來訓練一個CGAN網絡,cond
相關文章
相關標籤/搜索