G-TAD: Sub-Graph Localization for Temporal Action Detection

論文下載鏈接:https://arxiv.org/pdf/1911.11462.pdf 1 摘要 對於動作檢測而言,視頻的文本信息是十分重要的線索之一,但是當前的工作主要集中於時序文本信息(temporal context),而忽視了另一個同樣重要的語義文本信息(semantic context)。本文提出通過GCN模型自適應地融合多級語義文本信息,將時序動作檢測問題轉化爲子圖定位問題。具體就是將
相關文章
相關標籤/搜索