視頻物體檢測(VID) Impression Network for Video Object Detection

SenseTime出品 來源:https://arxiv.org/pdf/1712.05896.pdf 基於印象機制的高效多幀特徵融合,解決defocus and motion blur等問題(即視頻中某幀的質量低的問題),同時提高速度和性能。  類似TSN,每個segment選一個key frame(注意,TSN做視頻分類是在cnn最後才融合不同的segments)。特徵融合前需要用Optica
相關文章
相關標籤/搜索