Review networks for caption generation

註明:歡迎閱讀,討論。轉載及參考請註明出處。謝謝~ 論文連接:https://pdfs.semanticscholar.org/8736/3aa042cc23bfae3c865d9e8c280f5fe67de7.pdf 主要思想:attention機制每次只關注到局部,沒有考慮全局因素對預測的影響。該文將feature map作爲圖片的全局信息,然後通過LSTM單元獲得一個比feature map
相關文章
相關標籤/搜索