VSE++: Improving Visual-Semantic Embeddings with Hard Negatives

1、前言 1.論文要解決的問題: 輸入: MSCOCO,Flickr30K 輸出: image to text (text to image):rankhtml 2, 本文的方法創新: 提出了一種新的計算loss的方案,主要針對與hard negtive,加大樣本與hard negtive 的距離web 2、論文方法 Embedding 1) 圖像採用VGG19或者ResNet152進行特徵提取
相關文章
相關標籤/搜索