Grounded video description

Introduction Grounded video description. CVPR, 2019. 這篇文章的主要貢獻在於提出了新的密集事件描述ActivityNet Entities數據集,在Activity Captions的基礎上,添加了captions中NP名詞短語與視頻中的物體的對齊。 由於源數據集中數據量過大,因此採用了稀疏標註的方法,對每個視頻切割出segment,在每個seg
相關文章