Context R-CNN一種基於注意力機制的視頻檢測算法

最近遇到同一環境下,拍攝多張圖片,檢測結果存在差異的問題,故調研,考慮使用融合多幀信息去解決上述問題,發現這篇論文,該算法適用於我當前的問題,更適用於從事監控領域的同學,算法細節不贅述,看算法主體思路: 算法前半部分與雙階段RPN網絡基本無異, 只是輸入爲多幀圖片,得到若干anchor box的featrues,其中關鍵幀提取出n個,關鍵幀與其他幀共m個,此處雙階段檢測相比於單階段在視頻信息融合上
相關文章
相關標籤/搜索