「顧客就是上帝」,這句西諺揭示了顧客佔據着商業活動中心地位這一客觀規律。爲了能更好地服務顧客,優化商家自身的服務與產品,對顧客的分析與需求調研一直是商業經營分析中的重中之重。算法
在商業互聯網化、社會數字化的今天,這一規律愈加明顯。從Web1.0時×××始,Cookie就被髮明出來,用以對「顧客」進行數字化描述和建檔並歸一化其互聯網下的數字行爲。網絡
其後的Web2.0時代,隨着移動互聯網的發展,我的生活中的屏—人機交互端口變多了,原先用Cookie對 「顧客」 進行數字化的方式已沒法完成對我的全渠道全平臺跨屏的行爲歸一化,爲了解決這一問題,設備ID、SuperID應運而生。分佈式
當前, Web3.0正如火如荼地發展中,渠道、平臺、終端、屏幕隨着IOT的發展,經過雲端賦能,下沉霧化, 對「顧客」進行數字化描述的方式又迎來了更復雜更嚴峻的挑戰。有鑑於此,奇點雲與衆多有志於此的友商,在多年前就開始了對於新形態「顧客ID」的預研。目前基本達成的共識有兩點:ide
IOT時代來臨,原來的線下物理社會逐步數字化上線,對於這一開放的數字化環境,已經難以經過惟一有限的媒介數字設備對顧客及行爲數字化。這就須要從天然人身上直接數字化並抽取。
這一新形態數字ID須要可以較爲高效和準確地拉通原先Web1.0和Web2.0時代的既有數字化信息。
在經歷了一段時間摸索後,以人臉生物特徵爲基礎的Face ID方案逐漸顯露出優點,而 Face ID也成爲了當前奇點雲商業智能化方案中對於顧客數字化描述的主要技術方案。基於此,StartDT AI Lab在人臉數字化方向上作了充分且深刻的技術沉澱。下面就爲你們展現幾點:性能
人臉數字化的核心天然是人臉識別,其包含了人臉生物特徵的數字化和準確比對。做爲視覺智能引擎中不可或缺的一部分,StartDT AI Lab的人臉識別技術能夠解決複雜場景下的人臉識別問題。學習
好比動態視頻監控場景下的人臉識別,相較於約束場景下的人臉驗證所需的人臉識別技術,其一大挑戰是對無約束人臉的識別,難度在於進行人臉識別的人臉圖通常會存在模糊、遮擋、低分辨率、面部光照及表情變化巨大等,這些因素都會在必定程度上對人臉識別形成影響,甚至大幅下降人臉識別的準確率。而StartDT AI Lab對這種場景下的人臉識別準確率進行專項課題攻堅,主要研發採用了下面一些技術手段:大數據
01數據加強優化
當訓練數據面臨樣本量過少、質量分佈不均衡或者訓練集與實際場景分佈差別較大時,模型的泛化能力會嚴重降低,此時數據加強就頗有意義;StartDT AI Lab經過GAN網絡同時結合傳統圖像處理技術,進行樣本合成加強。視頻
02圖像處理圖片
在無約束場景下,通常獲取的圖像質量較差,例如對人臉而言,通常分辨率較差、 模糊、遮擋、低光等,StartDT AI Lab經過結合傳統方法和深度學習方法,對人臉圖像進行去噪、去模糊、超分辨等處理,從而得到更高質量的人臉圖片,提高實際場景模型準確性。
03大規模分佈式並行訓練
採用多機多卡的訓練方式,StartDT AI Lab目前支持上百萬個ID,上億張照片規模的訓練數據集。
正所謂有矛就有盾,有攻就有防。自從有了數字ID,就有了對應的***技術來破解盜用數字ID,這一問題到了Face ID時代依然存在,而且由於Face ID所在的是開放性數字場景,***手段更是豐富簡便了起來。
好比僅僅使用一個手機上的照片或者使用換臉APP就盜用了別人的人臉從而被認證,這樣就很是容易被犯罪分子利用,人臉識別的應用範圍就大打折扣了。所以,咱們須要在人臉識別進行前增長活體檢測加以應對。目前,人臉識別的主要***方法包括照片與視頻回放***以及立體面具***。
咱們在產品中針對不一樣的應用場景開發了多種活體檢測方法,針對無人零售場景,須要配合交互驗證的方式對用戶不友好,同時須要控制成本,所以咱們開發了基於單目RGB的靜默活體檢測方法。主要經過深度學習方式提取特徵以及基於多特徵融合的方法達到了目前場景下99.98%拒絕率,99.8%的經過率。目前算法已用在咱們的多種場景下,時刻爲咱們的人臉識別系統保駕護航。
(已集成在產品上的活體檢測演示)
在完成Face ID的提取以後,做爲數字化需求的天然延展,視頻智能引擎對人臉的相關信息也同步進行了數字化,例如年齡性別表情等。
目前,人臉年齡預測方面主要的難點在於如何協調年齡的連續性、年齡間的次序性、年齡分段的模糊性等,還有來自於實際場景中妝容、光照、角度等等的影響。
在人臉性別預測方面,主要問題在於intra-class variability,因此加大光照,角度等intra-class方面的加強數據有助於提高模型性能。
在人臉表情識別方面,碰到的難點主要有3方面:
各模式(光照,姿態等)下表情數據集不足;
因爲年齡、性別、種族、表情強度等因素不一樣形成high inter-subject variations;
因爲光照、姿態、遮擋等因素形成的large intra-class variability。
目前StartDT AI Lab選擇的年齡性別表情預測與識別算法在以上問題的解決方面有了很大的突破,再經過大數據樣本的訓練,取得了相較於目前市面上主流人臉年齡性別表情API更高的性能指標。
經過以上的技術展現,相信讀者對奇點雲視覺智能引擎中的人臉相關技術能力有了必定了解,也對Face ID爲主的Web3.0時代的「顧客」數字化描述這一主要方式有了必定認識。從目前奇點雲在Web3.0的實踐來看,Face ID在頭部20%高淨值VIP客戶的服務中能有充分的數字化保障,這也直接提升商家在商業模式中80%預期收益的落袋能力。然而對於剩下20%的預期收益,因爲其分散在80%長尾客羣的稀疏商業行爲中,如何以低成本的方式提升這部分預期收益的落袋向來是商業場景中的難點。有鑑於此,奇點雲從技術的角度解構了這部分商業場景,並經過技術的一次次突破,不斷地提高着預期收益的上限。而這背後的技術細節和故事正是本欄目下一期分享的主題,敬請期待!