image caption筆記（八）:《From Captions to Visual Concepts and Back》

時間 2020-12-23

原文原文鏈接

這篇文章是15年微軟的工作，是和谷歌《show and tell》同時期的文章，它們都去參加了微軟的Image Caption比賽（MS COCO caption challenge），總的結果是並列第一。文章的框架不是我們常見的encoder-decoder類型，但是仍然有啓發意義。文章生成caption的思路是（1）給出一幅圖像，首先使用視覺檢測器提取出圖像中可能存在的單詞。（2）提取

>>阅读原文<<