圖像生成文本(四) —— Show and Tell模型

由李飛飛團隊開發的 依然是基於encoder-decoder模型進行改編   使用了googlenet 相對於Multi-modal模型,其圖像特徵只使用了一次     與Encoder-Decoder的區別 由GooLeNet替換了Encoder,由GooLeNet得到hn
相關文章
相關標籤/搜索