論文介紹--Memory-Attended Recurrent Network for Video Captioning

時間 2020-12-30

標籤筆記人工智能深度學習基礎理論與技術實踐 VideoCaptioning encoder-decoder memory msvd msr-vtt 欄目系統網絡简体版

原文原文鏈接

Memory-Attended Recurrent Network for Video Captioning 這篇論文發表在2019年的CVPR上。作者Wenjie Pei等人來自騰訊和南方科技大學。研究動機目前做視頻描述的主流框架是編碼器-解碼器（encoder-decoder）結構。這種架構潛在的劣勢在於它無法捕捉存在於在當前視頻之外的視頻文本信息。作者爲了解決生成描述時只顯式地根據當前視

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。