MTCNN學習筆記

MTCNN由三個神經網絡組成:pnet、rnet、onet 1、pnet 將原始圖像縮放到不同尺度,形成圖像金字塔 將每個尺度的金字塔都送入神經網絡計算 pnet輸入: (12,12,3) pnet需要判斷該12*12*3的圖像中是否有人臉,並給出人臉框和關鍵點的位置 1)face classification 輸出向量形狀爲1*1*2,分別爲該12*12*3是人臉的概率,以及不是人臉的概率 2)
相關文章
相關標籤/搜索