DEX: Deep EXpectation of apparent age from a single image 論文閱讀

來自:IMDB-WIKI - 500k+ face images with age and gender labels  https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/網絡

該論文提出了Deep EXpectation(DEX)的表面年齡估計,該方法在2015年得到了ChaLearn LAP表面年齡估計的第一名。學習

做者提出了將年齡的迴歸問題轉化爲分類問題,這樣能夠用深度學習的cnn方法來訓練,訓練方法是用ImageNet訓練好的VGG-16網絡進行初始化,而後用IMDB-WIKI數據集進行finetune,最後再用LAP數據集再次進行finetune。測試

1、具體實現過程以下:blog

image

一、輸入包含人物的圖像;圖片

二、對圖片進行人臉檢測,對於每張圖片從-60°到+60°,以5°爲步進進行旋轉,另外也對圖片旋轉至-90°、90°、180°進行人臉檢測;ip

三、將檢測到的人臉區域上下左右向外擴展40%,將擴展後的區域裁切出來,最終圖片尺寸壓縮爲256x256;get

四、將全部裁切好的以及標註好的數據集放入VGG-16網絡結構進行訓練;深度學習

五、最終輸出爲101個類,即0~100歲,softmax輸出,輸出爲每一個年齡的機率,機率越大表示爲這個年齡的可能性越大。it

2、數據集io

一、IMDB上得到461,871張,WIKI上得到62,359張,共524,230張,最後爲了去除各年齡數據的不均衡,最終獲得260,282張圖片用於訓練;

二、LAP數據集有4699張人臉圖片,該數據集劃分爲三個部分,2476張用於訓練,1136張用於驗證,1087張用於測試。LAP數據集可http://chalearnlap.cvc.uab.es/dataset/18/description/下載。

3、評估方法

一、MAE(The standard mean absolute error):平均絕對偏差;

二、ε-error:每張圖片的檢測錯誤率,定義以下:

image


end

相關文章
相關標籤/搜索