視頻物體檢測文獻閱讀筆記

Impression Network for Video Object Detection 基於印象機制的高效多幀特徵融合,解決defocus and motion blur等問題(即視頻中某幀的質量低的問題),同時提高速度和性能。 類似TSN,每個segment選一個key frame(注意,TSN做視頻分類是在cnn最後才融合不同的segments)。特徵融合前需要用Optical flow(
相關文章
相關標籤/搜索