V4d:4d Convolutional Neural Networks For Video-level Representation Learning

本文是一篇ICLR2020的文章 文章地址: http://xxx.itp.ac.cn/abs/2002.07442 Open Review: https://openreview.net/forum?id=SJeLopEYDH Background 對於視頻分類、動作識別等任務來說,如何簡潔、高效地建模時序信息一直是重要的研究問題。3D-CNN的提出雖然提供了一個時序建模的方案,但是它的運算量一
相關文章
相關標籤/搜索