特徵提取和分類是典型計算機視覺系統的兩個關鍵階段。視覺系統的準確性、穩健性和效率很大程度上取決於圖像特徵和分類器的質量。特徵提取方法能夠分爲兩個不一樣的類別,即基於手工的方法和基於特徵學習的方法。分類器能夠分爲兩組,即淺層模型和深層模型。算法
特徵是任何獨特的方面或特性,用於解決與特定應用相關的計算任務。n個特徵的組合能夠表示爲n維向量,稱爲特徵向量。特徵向量的質量取決於其區分不一樣類別的圖像樣本的能力。良好的特徵應該是信息豐富的,不受噪聲和一系列變換的影響,而且計算快速。網絡
分類是現代計算機視覺和模式識別的核心。分類器的任務是使用特徵向量對圖像或感興趣區域(ROI)劃分類別。分類任務的困難程度取決於來自相同類別圖像的特徵值的可變性,以及相對於來自不一樣類別圖像的特徵值的差別性。可是,因爲噪聲(以陰影、遮擋、透視扭曲等形式),異常值(例如,「建築」類別的圖像可能包含人),模糊性(例如 ,相同的矩形形狀能夠對應於桌子或建築物窗戶),缺乏標籤,僅有小訓練樣本可用,以及訓練數據樣本中的正負覆蓋的不平衡。所以,設計分類器作出決策是一項具備挑戰性的任務。學習
傳統特徵描述符:傳統(手工設計)特徵提取方法分爲兩大類:全局和局部。全局特徵提取方法定義了一組有效描述整個圖像的全局特徵,所以,形狀細節被忽略。全局特徵也不適用於識別部分遮擋的對象。另外一方面,局部特徵提取方法提取關鍵點周圍的局部區域,所以能夠更好的處理遮擋。下面介紹一些局部特徵提取方法。設計
(1)HOG描述符——經過邊緣方向的直方圖來描述圖像內的對象外觀和形狀。實現分爲4個步驟:對象
1.梯度計算。在圖像的水平和垂直方向上,執行一維中心離散微分模板。數學
2.單元方向直方圖。單元內的每一個像素,基於該像素處梯度的模對每個梯度方向區間投加權票。模板
3.描述符塊。爲了處理光照和對比度的變化,經過將單元組合在一塊兒造成的更大的空間上相連的塊,局部地歸一化梯度強度。HOG描述符是來自全部區域內的、歸一化的單元直方圖部件的向量。效率
4.塊的歸一化。能夠經過L2範數或者L1範數進行歸一化。神經網絡
(2)SIFT——尺度不變特徵變換搜索
SIFT提供了一組對象的特徵,這些特徵對於對象縮放和旋轉是健壯的。分爲如下4個步驟:
1.尺度空間的極值偵測。SIFT使用高斯差分(DoG),在全部尺度和圖像位置上搜索DoG圖像以尋求局部極值。
2.關鍵點精肯定位。此步驟經過查找具備低對比度或在邊緣上局部性較弱的那些點,從潛在關鍵點列表中移除不穩定點。
3.方向定位。爲了實現圖像旋轉的不變性,基於其局部圖像屬性爲每一個關鍵點分配一個不變的方向。而後能夠相對於該方向表示關鍵點描述符。
4.關鍵點描述符
SIFT數學思想複雜,須要多年的研究。
(3)SURF——加速健壯特徵
SURF是SIFT的加速版。在SIFT中,高斯拉普拉斯算子用DoG近似,以構造尺度空間。SURF經過使用盒式濾波器估算LoG來加速此過程。
傳統的手工工程特徵的侷限性
計算機視覺的進步是基於手工工程特徵的。然而,特徵工程師困難的、耗時的,而且須要關於問題領域的專業知識。手工工程特徵的另外一個缺點是它們在信息方面太稀疏,沒法從圖像中捕獲。使用諸如深度神經網絡的自動特徵學習算法能夠解決全部這些問題。