image caption初探

看圖說話怎麼玩 1、首先你需要一些有標題的數據集比如coco的image caption。Flickr8k數據集也不錯。 2、基礎模型框架 可以參考這個作者寫的代碼(初級):https://github.com/anuragmishracse/caption_generator 該作者使用的數據集vocab_size字典庫的大小爲8256. 模型的輸入X的其中一部分是(224,224,3)的圖像經
相關文章
相關標籤/搜索