Question-Guided Spatio-Temporal Contextual Attention for Video Question Answering 論文閱讀筆記

1. 主要解決了什麼問題?怎麼解決的? 解決的問題: 現有方法沒有充分利用 時空信息 與 question 的關係。 原文是這麼說的:「the relationship between spatio-temporal information and question still has not been well utilized in most existing methods for Vide
相關文章
相關標籤/搜索