《Video Action Transformer Network》

這周閱讀了《Video Action Transformer Network》這篇文章,發表於2019年度的CVPR,並且做了oral talk,作者是卡內基梅隆和Google的研究人員,代碼開源在:http://rohitgirdhar.github.io/ActionTransformer。 模型的目標是針對視頻中的某一幀進行動作的檢測和分類(此幀中包含多個人物和不同的動作,類似於目標檢測),
相關文章
相關標籤/搜索