論文介紹--Memory-Attended Recurrent Network for Video Captioning

Memory-Attended Recurrent Network for Video Captioning 這篇論文發表在2019年的CVPR上。作者Wenjie Pei等人來自騰訊和南方科技大學。 研究動機 目前做視頻描述的主流框架是編碼器-解碼器(encoder-decoder)結構。這種架構潛在的劣勢在於它無法捕捉存在於在當前視頻之外的視頻文本信息。作者爲了解決生成描述時只顯式地根據當前視
相關文章
相關標籤/搜索