神經網絡和深度學習目前爲處理圖像識別的許多問題提供了最佳解決方案,而基於MTCNN(多任務級聯卷積神經網絡)的人臉檢測算法也解決了傳統算法對環境要求高、人臉要求高、檢測耗時高的弊端。算法
基於MTCNN多任務級聯卷積神經網絡進行的人臉識別——數據庫
MTCNN主要包括三個部分,PNet,RNet,ONet網絡
測試階段大概過程
首先圖像通過金字塔,生成多個尺度的圖像,而後輸入PNet。性能
PNet因爲尺寸很小,因此能夠很快的選出候選區域,可是準確率不高,而後採用NMS算法,合併候選框,而後根據候選框提取圖像。
學習
做爲RNet的輸入,RNet能夠精確的選取邊框,通常最後只剩幾個邊框,最後輸入ONet。測試
ONet雖然速度較慢,可是因爲通過前兩個網絡,已經獲得了高几率的邊框,因此輸入ONet的圖像較少,而後ONet輸出精確的邊框和關鍵點信息。
訓練主要包括三個任務——
人臉分類任務:利用正樣本和負樣本進行訓練
人臉邊框迴歸任務:利用正樣本和部分樣本進行訓練
關鍵點檢測任務:利用關鍵點樣本進行訓練.net
實例——
瞭解了MTCNN多任務級聯卷積神經網絡,世紀晟科技主要利用MTCNN多任務級聯卷積神經網絡進行人臉識別任務,從世紀晟人臉識別技術能夠直觀的體驗全鏈接神經網絡的威力,並且能夠看到其過程與結果的可視化。
世紀晟人臉識別技術使用的這種級聯的結構進行人臉檢測和特徵點檢測,速度快效果好,能夠考慮在移動設備上使用。這種方法也是一種由粗到細的方法,和Viola-Jones的級聯AdaBoost思路類似。blog
在深度學習的動態3D人臉識別技術中,世紀晟人臉檢測在10億人臉數據庫中進行3D人臉特徵比對,其中包含了邊框標註數據及5個點以上的關鍵點信息。圖片
總結——
本文參考世紀晟人臉識別技術使用的MTCNN級聯結構進行人臉檢測和特徵點檢測學習。深度學習
MTCNN多任務級聯卷積神經網絡使得人臉識別速度快效果好,在人臉檢測和特徵點定位的任務上,MTCNN具備實時處理的性能,利用了檢測和對準之間固有的關係來加強他們的性能。特別在預測人臉及臉部標記點的時候,經過三階的級聯卷積神經網絡對任務進行從粗到精的處理。世紀晟人臉識別檢測就是這種由粗到細的方法,和Viola-Jones的級聯AdaBoost思路類似。
簡單而言,世紀晟人臉識別檢測技術就是基於MTCNN多任務級聯卷積神經網絡,第一步讓機器思考如何選擇待檢測區域:圖像金字塔+P-Net;第二步思考如何提取目標特徵:CNN;最後將在檢測和特徵提取的基礎上判斷是否是指定目標:級聯判斷。