視頻物體檢測(VID) Impression Network for Video Object Detection

時間 2020-12-30

原文原文鏈接

SenseTime出品來源：https://arxiv.org/pdf/1712.05896.pdf 基於印象機制的高效多幀特徵融合，解決defocus and motion blur等問題（即視頻中某幀的質量低的問題），同時提高速度和性能。類似TSN，每個segment選一個key frame（注意，TSN做視頻分類是在cnn最後才融合不同的segments）。特徵融合前需要用Optica

>>阅读原文<<