Knowledge Integration Networks for Action Recognition AAAI 2020

AAAI 2020 碼隆科技實驗室+南京大學 1 摘要 在這項工作中,我們提出了用於視頻動作識別的知識集成網絡(KINet)。KINet能夠聚合有意義的上下文特徵,這些特徵對於識別動作非常重要,例如人類信息和場景上下文。我們設計了一個由一個動作識別主分支和兩個輔助分支組成的三分支體系結構,該結構允許模型對動作識別中的人和場景知識進行編碼。我們探索了兩種預先訓練的教師網絡模型來提取人類和場景的知識,
相關文章
相關標籤/搜索