Context R-CNN一種基於注意力機制的視頻檢測算法

時間 2021-01-12

原文原文鏈接

最近遇到同一環境下，拍攝多張圖片，檢測結果存在差異的問題，故調研，考慮使用融合多幀信息去解決上述問題，發現這篇論文，該算法適用於我當前的問題，更適用於從事監控領域的同學，算法細節不贅述，看算法主體思路：算法前半部分與雙階段RPN網絡基本無異，只是輸入爲多幀圖片，得到若干anchor box的featrues，其中關鍵幀提取出n個，關鍵幀與其他幀共m個，此處雙階段檢測相比於單階段在視頻信息融合上

>>阅读原文<<