MDNet -- 學習用於視覺跟蹤的多域卷積神經網絡

摘要 作者提出了一種新穎的視覺跟蹤算法,基於一個來自有區別訓練的CNN的表示(representation)。算法中使用大量跟蹤視頻的ground-truth來對CNN進行預訓練,以獲得通用的目標表示。 網絡由共享層和特定域的層的多分支組成,其中域對應於獨立的訓練等級,並且每個分支負責一個二分類去識別每個域中的目標。我們針對每個域迭代地訓練網絡來獲得共享層中的通用目標表示。 當跟蹤一個新的視頻序列
相關文章
相關標籤/搜索