自零售領域近些年圍繞轉型升級建設性地提出了以「人、貨、場」三核心爲基礎的新零售藍圖以後,各方新技術蜂擁在零售的各型場景中角力。在以前的分享中,咱們主要介紹了奇點雲是如何經過人工智能技術,從「人」的維度切入零售場景的。而本文將着重介紹奇點雲的人工智能技術是如何從「貨」的維度賦能零售商業的。前端
視覺智能引擎做爲奇點雲AI落地的第一步,在商品數字化方面發揮着主要做用。而從視覺角度來講,「貨」的形態差別相較於「人」來講有了顯著增長。不一樣的垂直行業爲順應市場需求所開發的產品,不管在產品功能仍是形態上都千差萬別,甚至同類型產品也會產生出不一樣的形態以順應差別化的細分需求。這對視覺智能引擎提出了新的挑戰,也激發出了StartDT AI Lab更大的技術突破。下面從奇點雲已經商業落地的場景中選了幾個比較有表明性的行業場景來展現StartDT AI Lab已取得的技術突破。算法
咱們在17年率先推出服裝識別技術,結合產品——奇點魔鏡實現落地。在這個場景中,用戶站在奇點魔鏡前站定幾秒後,奇點魔鏡首先將對用戶的穿着進行分割理解,從中分離出T恤、風衣、夾克、牛仔褲等各類類型的服飾,而後經過對單品服飾的分析,例如T恤,咱們能夠對其抽取特徵,分析出T恤的風格、袖長、版型等屬性,最後在咱們自建的百萬級服飾商品庫中,使用推薦算法爲用戶推薦類似的、配套的商品,從而達到引流客戶、智能導購的效果。數據庫
在這個鏈路中,咱們當時碰到的主要問題和解決方案:網絡
✨1.獲取用戶準確的衣着信息並獲取特徵時,像T恤、短褲這樣上下裝明顯的衣着較容易獲取,但像連衣裙、風衣類較長的衣着卻較難處理。分佈式
咱們經過收集大量數據、清洗打標、完善數據集,並使用級連方法,先對服飾一級標籤進行檢測分析,再進行二次處理,從而提升了分割效果。ide
✨2.服飾屬性多樣且沒有統一的標準,如何快速同時判斷成爲難題。性能
咱們將屬性的分類器各自獨立互不影響,使用特徵做爲輸入,減小了重複運算,另外咱們將分類器同時接在Graph中,使總體過程End-to-End,快速有效。學習
✨3.大規模檢索:當數據庫較大時,檢索速度慢,沒法快速響應。大數據
咱們將比對數據庫部署在分佈式集羣上,實現了特徵比對層面的map-reduce,使咱們在應對各類級別的比對時遊刃有餘。人工智能
咱們在快消飲品行業已有近兩年的探索歷史。各式各樣的飲品——包括礦泉水、碳酸飲料、果汁、啤酒、白酒等均可以在奇點魔櫃中售賣。咱們經過自研的深度學習算法、數據採樣方法,配合咱們定製化的硬件配置,實現了在商用場景中99%以上的識別準確率。咱們將貨損率控制在1%之內,低於快消飲品行業平均貨損水平。此外,咱們在不到1平米的佔地空間上實現了極高的坪佔比,單櫃單月零售額可達千元級別,卻僅需少許的維護工做。
在正式商用的背後,StartDT AI Lab主要的contribution有如下幾點:
No.1 快速有效的小物體檢測算法
和大多數場景不一樣,咱們的檢測目標每每是最小邊接近16像素的小目標,且在一張圖上有至關多的目標。咱們經過自適應anchor的方法,使先驗anchor更加準確;此外咱們經過一種特徵加強算法,使細節特徵得以在深度網絡中儘量減小損失,從而避免了因特徵過少帶來的低分值檢測結果不穩定的問題。此外咱們還自研了一種自蒸餾方法,在不增長參數的狀況下提高了模型準確率,從而達到了商用水準。
No.2 與度量學習結合的識別技術
度量學習在過去的幾年中被普遍使用在人臉識別模型上,並取得了很是不錯的效果。咱們將其引入商品識別,結合經典的神經網絡方法,使識別結果更加準確可靠;此外模型還可輸出可比對特徵,支持特徵比對方式出結果,支持不一樣類間類似比較,從而在選品層面就避免了類似商品同時售賣沒法識別的問題。
No.3 小數據集加強
咱們的數據集相對使用場景,實際上是一個小數據集。如何使用小數據集在大數據場景下得到商用級準確度?咱們自研了一種mix方法,使檢測模型得到了很是高的召回率;此外咱們還使用了GAN,在訓練分類器的過程當中同時訓練生成器,再拿生成結果同時訓練分類器,使分類器訓練更充分,更平滑。
在生鮮/藥品等垂直領域,咱們也勇於摸索和嘗試,發揮自有深度學習算法和採樣方法的優點,結合自研的硬件優勢,獨創能將繁複多類的生鮮不受類別影響的智能貨櫃。衆所周知,在垂直領域中,同一sku的外觀變化多樣,適配成本高。咱們經過特定產品設計,完美支持各種蔬菜水果等生鮮,準確率更是能夠作到近乎100%。讓顧客不受限於菜市場/藥房等特殊場地的限制同時,更能夠發揮無人貨櫃的完美優點——不受時間限制。
(從上至下爲藥品類識別、生鮮類識別)
StartDT AI Lab在黑暗中探索的收穫與創新:
No.1 新穎的深度學習式場景思考
爲了擺脫生鮮場景下,各類形狀和尺寸帶來的異同和難以兼容,以及客戶快速上新的切實需求,咱們在場景落地的實際道路上,結合商品的特性、產品的優點和深度學習算法的原理,給奇形怪狀的生鮮產品進行特殊的包裝,該方案解決了生鮮產品之間的差別性,並能支持客戶快速上新。
No.2 獨具創新特點的數據增廣
光有新穎的方案設計還不足以讓深度學習在一個實際場景中完美落地,準確率是客戶第一要素,數據是深度學習的資本。StartDT AI Lab在深刻分析了生鮮和藥品等垂直領域的數據特性和算法性能以後,創新性地在採樣數據集上進行數據增廣,讓準確率近乎完美,詮釋了什麼是將深度學習進行落地的概念。
從以上案例中,呈現了奇點雲在「貨」的數字化探索,雖然仍是比較初步的商品數字化階段,但也經過AI技術首次實現了商品售賣週期內的全鏈路數字化跟蹤。並在此基礎上實現了零售前端成本削減,提升了用戶調研自動化的效率。爲了讓商業更智能,StartDT AI Lab將繼續前行,請持續關注~