MDNet -- 學習用於視覺跟蹤的多域卷積神經網絡

時間 2021-01-03

原文原文鏈接

摘要作者提出了一種新穎的視覺跟蹤算法，基於一個來自有區別訓練的CNN的表示（representation）。算法中使用大量跟蹤視頻的ground-truth來對CNN進行預訓練，以獲得通用的目標表示。網絡由共享層和特定域的層的多分支組成，其中域對應於獨立的訓練等級，並且每個分支負責一個二分類去識別每個域中的目標。我們針對每個域迭代地訓練網絡來獲得共享層中的通用目標表示。當跟蹤一個新的視頻序列

>>阅读原文<<