G-TAD: Sub-Graph Localization for Temporal Action Detection

時間 2021-01-02

原文原文鏈接

論文下載鏈接：https://arxiv.org/pdf/1911.11462.pdf 1 摘要對於動作檢測而言，視頻的文本信息是十分重要的線索之一，但是當前的工作主要集中於時序文本信息（temporal context），而忽視了另一個同樣重要的語義文本信息（semantic context）。本文提出通過GCN模型自適應地融合多級語義文本信息，將時序動作檢測問題轉化爲子圖定位問題。具體就是將

>>阅读原文<<