《Video Action Transformer Network》

時間 2021-01-02

原文原文鏈接

這周閱讀了《Video Action Transformer Network》這篇文章，發表於2019年度的CVPR，並且做了oral talk，作者是卡內基梅隆和Google的研究人員，代碼開源在：http://rohitgirdhar.github.io/ActionTransformer。模型的目標是針對視頻中的某一幀進行動作的檢測和分類（此幀中包含多個人物和不同的動作，類似於目標檢測），

>>阅读原文<<