image caption初探

時間 2020-12-20

原文原文鏈接

看圖說話怎麼玩 1、首先你需要一些有標題的數據集比如coco的image caption。Flickr8k數據集也不錯。 2、基礎模型框架可以參考這個作者寫的代碼(初級)：https://github.com/anuragmishracse/caption_generator 該作者使用的數據集vocab_size字典庫的大小爲8256. 模型的輸入X的其中一部分是(224,224,3)的圖像經

>>阅读原文<<