學習筆記十二——Deformable Convolutional Networks

一、提出問題 視覺識別中一個關鍵挑戰是如何在目標尺度,姿態,視點和部件變形中適應幾何變化或建模幾何變換,即適應物體的形變。 現有解決方法:1)建立具有足夠期望變化的訓練數據集。例如通過仿射變換增加現有數據樣本,即學習足夠多的數據使模型能夠適應各種形狀的物體。 2)使用變換不變的特徵和算法。如SIFT(尺度不變特徵變換)和基於滑動窗口的目標檢測。 存在的缺點:1)針對第一個解決方法,幾何變換被假定是
相關文章
相關標籤/搜索