R-C3D: Region Convolutional 3D Network for Temporal Activity Detection

這篇文章是ICCV 2017的一篇文章,作者主要是以C3D網絡爲基礎。借鑑了Faster RCNN的思路,對於任意的輸入視頻L,先進行proposal,然後3D-pooling,最後後進行分類和迴歸操作。文章主要貢獻點有3個: 可以針對任意長度視頻、任意長度行爲進行端到端的檢測 速度很快(是目前網絡的5倍),通過共享Progposal generation 和Classification網絡的C3
相關文章
相關標籤/搜索