image caption筆記(八):《From Captions to Visual Concepts and Back》

這篇文章是15年微軟的工作,是和谷歌《show and tell》同時期的文章,它們都去參加了微軟的Image Caption比賽(MS COCO caption challenge),總的結果是並列第一。 文章的框架不是我們常見的encoder-decoder類型,但是仍然有啓發意義。 文章生成caption的思路是 (1)給出一幅圖像,首先使用視覺檢測器提取出圖像中可能存在的單詞。 (2)提取
相關文章
相關標籤/搜索