Video Analysis 相關領域解讀之Video Captioning(視頻to文字描述)

之前兩次分別介紹了video analysis中的action recognition 以及 temporal action detection 這兩個領域。這兩個領域算是對視頻mid-level的理解,而我最近看論文主要在關注如何去理解視頻的高層語義(high-level)信息,這方面一個重要的領域就是video captioning。video captioning的任務是給視頻生成文字描述,
相關文章
相關標籤/搜索