Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents心得體會

在本文中,爲了回答有關電影的問題,提出了一個分層存儲網絡(LMN),該網絡分別通過靜態字存儲模塊和動態字幕存儲模塊來表示幀級和剪輯級電影內容。發表於AAAI2018 文章鏈接:Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents 一、文章引入 橋接視覺理解和人機交互是人工智能的一項艱鉅任
相關文章
相關標籤/搜索