重磅!刷新兩項世界紀錄的騰訊優圖人臉檢測算法DSFD開源了!

近日,知名開源社區Github上有個名爲DSFD(Dual Shot Face Detector)的算法引發了業內關注,它正是來自於騰訊優圖。目前,該算法已經被計算機視覺頂級會議CVPR 2019接收,而且在2018年10月刷新了兩個權威的人臉檢測數據集WIDER FACE和FDDB上的新紀錄。git

Github開源地址:github

https://github.com/TencentYoutuResearch/FaceDetection-DSFD算法

論文公開地址:https://arxiv.org/abs/1810.10220
小程序


「三點創新」打造人臉檢測領域最值得參考的代碼安全



人臉檢測算法是在圖像上,檢測出人臉的位置(一般以矩形框形式輸出),是人臉配準、人臉屬性識別、人臉核身、人臉檢索等技術的基礎。優圖這次提出的DSFD人臉檢測算法,主要有3點創新:
微信

(1)設計了一種新的「特徵加強」模塊(FEM:Feature Enhance Module)
網絡

FEM在採用Top-Down層間信息融合的同時,在同一「感覺野」內作了更多的enhancement。所以在network width and depth上學習到了更有效的context和semantic信息。框架

(2)提出了「分層錨點漸進」式的代價函數監督(PAL:Progressive Anchor Loss)函數

模型採用2個層級(hierarchy),基於第一層(low-level)和第二層(high-level)的差別性,適配了不一樣尺寸的anchor。在訓練過程當中,PAL對整個模型造成了更有效的監督。工具

(3)設計了一種「改進的錨點匹配策略」(Improved Anchor Matching Strategy)

One-stage detector因爲在輸出層分配有密集的anchor,anchor與face匹配的好壞直接影響訓練效果,優圖的研究員們在data augmentation過程當中充分考慮了不一樣大小的face和各個anchor的關係,提出了一種新的數據擴增方法。

(算法總體流程圖)


效果提高,來自優圖不斷的研究

隨着近幾年人工智能技術的發展,國內外很多機構、企業都在進行人臉檢測的相關研究。騰訊優圖的研究員們發現,雖然以前的人臉檢測算法大都採用深度學習模型,並在特徵學習的過程當中也有采用特徵金字塔網絡(Feature Pyramid Network),但在面對遮擋、暗光、大姿態、小臉等複雜場景時,仍容易出現誤檢或漏檢的狀況。所以在FPN基礎上,騰訊優圖團隊採用了3種不一樣級聯方式的空洞卷積(Dilated Convolution),設計了特徵加強模塊FEM,充分學習到了不一樣感覺野下的人臉特徵。

(複雜場景下的人臉檢測效果展現)

然而,在新算法探索的過程當中,並非一路順風的。這個項目從去年7月中旬啓動,進行到第三週,檢測效果已經在top5了,但優圖的研究員們清楚,到這裏還遠遠不夠。在接下來的兩個多月裏,想要提高效果卻愈來愈難。就好像登山,前面爬得很快,越到後面,對耐力和決心的要求就越高,騰訊優圖高級研究員Casey回憶道:「那段時間,我和其餘幾位同事實驗了不少方案,不少時候是多個方案同時跑,甚至有些方案跑了4-5天后,發現失敗了,又得作新的嘗試。」失敗後,幾個研究員就近在工位旁邊的玻璃房裏,一塊兒分析緣由,開始摸索下一套試跑方案。在3個多月的反覆「試跑-推翻-試跑」中,最後終於跑出一套你們都滿意的算法。不負所望,該算法論文也已被CVPR2019接收。


走出實驗室,爲業務創造價值;

代碼開源,與同行共同探討


算法從實驗室走出來,不是立馬就能直接套用到業務裏。事實上,論文裏的模型一般比較大,致使實時性很差。在使用時,需結合實際應用狀況壓縮、裁剪,總體模型會作必定的調整。目前,騰訊優圖的人臉檢測技術已在安防、金融、社交、交通、零售等多個應用場景落地,並在手機QQ、微衆銀行、每天P圖等多個公司內外部產品上進行應用驗證。以安防領域爲例,騰訊優圖天眼智能安防平臺以警務、安防需求爲導向,是優圖團隊面向稽查布控、刑偵辦案、社會安防等多場景推出智能化海量人臉檢索解決方案。

(騰訊優圖天眼智能安防平臺)

2017年,騰訊對外開源節奏開始加快,主要覆蓋AI、雲計算、騰訊遊戲、騰訊安全、小程序等相關領域。而騰訊優圖的計算機視覺技術的開源更是其中重要的一環。2017年7月,騰訊優圖首個AI開源項目NCNN已經正式開源,這是一個爲移動端極致優化的高性能神經網絡前向的計算框架,是業內首個爲移動端優化的開源神經網絡推斷庫。2018年,NCNN宣佈正式加入ONNX,截止目前,NCNN的Github star數已接近6000。隨着計算機視覺技術的不斷開源, AI開發者能更快實現從研究到模型的落地部署,也能更方便地在不一樣框架間切換,爲每項任務選取最優的開發工具。相信隨着愈來愈多的AI機構、企業和我的的算法開源,將驅動整個AI研究更快發展和落地。


推薦閱讀

8行代碼中的人臉檢測,識別和情感檢測!


關於圖書

《深度學習之TensorFlow:入門、原理與進階實戰》和《Python帶我起飛——入門、進階、商業實戰》兩本圖書是代碼醫生團隊精心編著的 AI入門與提升的精品圖書。配套資源豐富:配套視頻、QQ讀者羣、實例源碼、 配套論壇:http://bbs.aianaconda.com 。更多請見:https://www.aianaconda.com


點擊「閱讀原文」進入大蛇智能鑑黃世界

本文分享自微信公衆號 - 相約機器人(xiangyuejiqiren)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索