輕鬆上手UAI-Train,拍拍貸人臉識別算法優化效率提高85.7%

「UAI-Train平臺可讓咱們方便地在短時內使用大量的GPU資源,用較低的成本訓練海量的數據集,提升算法模型迭代優化的效率。」 — 拍拍貸算法研究員 朱運git

UAI-Train是什麼github

UAI-Train是面向AI訓練任務的大規模分佈式計算平臺,基於P40、V100等GPU雲主機集羣,經過分佈式擴展,最高可實現192TFlops的單精度計算能力。提供一站式訓練任務託管服務,可自動化解決計算節點調度、訓練環境準備、數據上傳下載以及任務容災等問題,並支持按需收費、成本可控,無需擔憂資源浪費。在視頻圖像識別、天然語言處理、語音處理等領域均已有諸多實踐。算法

拍拍貸接入UAI-Train的效果網絡

經過使用分佈式GPU訓練平臺,700W人臉數據的模型訓練所需時長可從原先的一週縮短至一天,總體算法優化效率提高85.7%, 相應的迭代頻率也提升數倍,爲更深層次的模型結構試驗提供了可能。同時UAI-Train平臺備有大量GPU資源,拍拍貸的算法工程師能夠同時探索多種算法模型結構,極大縮短初期算法結構探索的時間。最重要的是UAI-Train平臺具有按需收費的特性,拍拍貸人臉識別算法的 GPU資源成本可由原先的上萬元/月,降低至數千元/月, GPU資源的有效利用率也達到了100%。併發

表:UAI-Train與購買GPU資源的特性對比框架

關於拍拍貸機器學習

拍拍貸是一家行業領先的金融科技公司,同時也是一家很是注重技術驅動、強調自主研發的高科技公司。一直以來很是重視AI技術的探索和應用,涉及到計算機視覺、語音分析和建模、天然語言處理、複雜網絡分析等針對特定非結構化數據的領域,並將遷移學習、主動學習、強化學習、多任務學習、在線學習、非監督半監督等各類機器學習算法應用至多種業務場景。尤爲是人臉識別、OCR、不良中介識別和欺詐團伙挖掘、智能對話機器人、社交文本挖掘等項目,在實際的業務實踐中取得了不俗的效果,極大地提高了風險反欺詐水平和運營效率。分佈式

人臉識別函數

人臉識別是拍拍貸AI技術的一個重要研究方向,它經過算法識別人的臉部特徵,從而能夠作到實時地從圖片或者視頻流中檢測和追蹤特定的人。學習

目前拍拍貸自研人臉識別算法,在700W規模多年齡段、多姿態、多表情、多環境的人臉圖片上進行訓練。經過嘗試不一樣的網絡結構,包含Inception-v三、優化後的resnet等,以及多種損失函數,例如triplet_loss、sphere、cosine、arc_loss等來優化人臉識別算法,從而提高1:1人臉認證、1:N人臉搜索、N:N人臉交叉比對、人臉聚類等場景的識別精度,並將此類技術應用於拍拍貸的風險監控、反欺詐等業務,併發揮了重要做用。

圖:人臉識別業務場景

面臨的問題

算法人員在優化人臉識別算法的過程當中發現**使用單臺GPU機器迭代一次算法須要一週左右的時間,**效率太低影響研發進度,可是採購更多的GPU機器來探索不一樣算法會致使資源成本線性增加;此外因爲算法調優工做涉及諸多研究內容,例如算法效果分析、新算法調研、開發等,實際的資源使用率不高。

接觸UAI-Train

在一次線下技術交流活動中,拍拍貸技術人員瞭解到UCloud提供一種面向人工智能算法訓練的UAI-Train平臺,並支持GPU資源的按需租售服務,同時該平臺上還可執行多機多卡的分佈式訓練任務。

爲了提高模型訓練的效率,充分高效地利用更多的新數據來進一步提升其準確率,拍拍貸抉擇後選擇嘗試UAI-Train平臺。UCloud AI團隊在GitHub上發佈了適配UAI-Train平臺的Insightface開發案例,用於協助拍拍貸的算法工程師很方便地將單機的人臉識別算法轉化成支持分佈式訓練的人臉識別算法,併成功在UAI-Train平臺上進行算法的快速優化。

Insightface是GitHub上一個基於MXNet框架的開源人臉識別項目(https://github.com/deepinsight/insightface)。UCloud基於insightface開發了一整套能支持分佈式訓練的人臉識別訓練和在線推理的案例代碼,併發布在GitHub上(https://github.com/ucloud/uai-sdk/tree/master/examples/mxnet/insightface),其中包括基於MXNet框架的代碼及開發案例。拍拍貸的工程師基於該案例,結合自身人臉識別算法的實現和數據,一週時間內就完成了開發和調試, 並順利在UAI-Train平臺上逐步展開人臉識別算法的訓練迭代工做。

圖:人臉識別算法接入過程

在屢次算法優化迭代嘗試後,拍拍貸經過利用高維向量表徵人臉,餘弦距離表達類似度,最終在開源測試集準確率表現爲:lfw 99.8%, cfp_fp 97%, agedb_30 98.2% ,實際業務應用中的準確率高達 99% 以上,進一步提高了風險監管、反欺詐等業務的效率。

後續拍拍貸和UCloud計劃在更多算法場景和應用場景展開深刻合做,更好地服務於金融領域客戶。

對人工智能更多應用場景和解決方案感興趣的,歡迎掃描下方二維碼進羣交流。

TIC 2019報名火熱進行中,歡迎掃描下方二維碼或點擊閱讀原文加入咱們,共同探討企業上雲的更多落地案例!

相關文章
相關標籤/搜索