觀遠數據已經幫助聯合利華、百威英博等多家500強客戶實施需求預測,有大量的零售領域數據預測經驗。咱們看到,500強企業之因此願意花上百萬,甚至大幾百萬來作AI預測項目,是基於其龐大的業務體量來評估ROI後做出的選擇:算法
• 一方面,高質量的數據預測確實須要專業的數據科學家和分析人員深刻了解業務場景,不斷迭代優化預測模型,通過長時間的錘鍊才能得到;架構
• 另外一方面,當業務規模足夠大時,細微的預測準確度的提高都能給企業帶來鉅額的利潤回報。函數
但同時,咱們也意識到,不是任何企業都有這個資金實力去作此類高質量的數據預測的,而且在業務需求上也可能僅僅是想作一些初步預測來爲決策提供參考。所以,爲了知足這類客戶的預測需求,觀遠數據的「AI預測引擎」將爲他們提供 入門級的零售預測操做門檻,同時又能爲他們提供 比通常的統計預測方法更精準的預測結果!工具
瞭解過觀遠產品的朋友們都知道,觀遠數據在BI平臺裏面內置了Smart ETL智能數據處理模塊。該模塊基於Spark大數據計算引擎開發,提供拖拽式、圖形化的數據流開發方式,使得通常業務人員也能作專業的數據分析處理。大數據
通常的ETL過程整理主要作的是數據的清洗、轉換、關聯、加載等操做,那觀遠的Smart ETL何以稱之爲智能呢?這是由於Smart ETL中除了支持Spark自己自帶的函數以外,還支持自定義的UDF、UDAF函數開發,具備很是強大的智能算子擴展能力。優化
舉個例子,若是你想挖掘商品間的潛在聯繫,開拓更多銷售機會,你就可使用Smart ETL內置的「關聯性挖掘」這個智能算子來快速實現商品銷售關聯分析。架構設計
而「AI預測引擎」則是另外一個重要的智能算子。你能夠用它來作各類級別的銷售預測,大到門店,小到品類,甚至SKU的預測。有了這些可靠的銷售預測的數據,你將實現:設計
下降庫存金額:對於庫存成本較高的零售企業,經過銷售預測來指導進貨與庫存,在保證供給的前提下,進一步下降庫存金額,下降成本。下降報廢風險:對於可售時長比較短的商品(好比水果、麪包、鮮食),經過精準的銷售預測,來指導備貨,下降報廢率(並非追求零報廢),節約成本。開發
把握銷售機會:對於潛在的銷售機會,好比節日、活動、天氣變化等,經過銷售預測來指導提早備貨,充分把握銷售機會,最大化銷售額。數據分析
指導排產、配送:對於能夠作到自產自銷的零售企業來講,準確的銷售預測,還可以將預測數據倒推到生產、配送環節,指導排產、物流。
指導人員配置,優化排班:經過分時段的銷售預測,來指導門店進行更爲合理的數據化排班,最大化地利用人力成本,同時保障客戶消費體驗。
評估銷售目標的進度:經過對當前累計銷售額與將來銷售預期的預測分析,評估銷售目標的完成進度與質量。有須要的還能夠及時調整銷售目標,作到敏捷運營。
加強客戶體驗:經過進銷存各個環節的預測,加強客戶體驗,避免各種因缺貨、延遲交貨、延遲發貨等狀況致使的客戶消費體驗降低的狀況發生。
「AI預測引擎」智能算子
在觀遠Smart ETL中,用戶僅須要拖入一個「AI預測引擎」算子,接入事先預處理好的歷史數據,而後簡單配置日期字段、預測指標,以及指標聚合維度(日/周/月/季度/年)和預測週期數,即可開始預測。預測結果能夠輸出到數據集進行下一步的展現分析與決策支持。
「AI預測引擎」節點配置
觀遠數據的「AI預測引擎」主要適用於零售企業的銷售預測或需求預測。上圖所示只是一個極簡模式的預測算子。但即使配置如此簡單,卻能輸出至關精準的預測結果。
• 對 零售行業門店級別(以超市數據爲例)的日商預測平均準確度達到 83%(MAPE≈17.65%),個別門店 接近 90%;
• 而細化到 單門店單品類(鮮肉類)的日商預測,準確度達到84%。
在這個基礎上,咱們還能提供更多配置項,添加諸如天氣狀況、促銷活動、品類級別的日期特徵等外部信息,進一步提高數據預測的準確度;同時也能夠提供多門店、多品類的批量預測。
爲何如此簡單的操做,便能實現還不錯的銷售數據預測呢?
這是由於架構層面觀遠數據將預測算法封裝成Spark UDF函數,有機地融合進Smart ETL,成爲一個可點選配置的智能算子;算法層則採用了先進的算法,並將觀遠數據多年沉澱的零售行業預測經驗轉化爲相應日期特徵優化配置後預置進算法包裏。
如此一來,看似簡單的時序預測,其實已經包含影響零售行業銷售數據的週期性特徵、節假日特徵以及節前節後特徵,這樣的預測天然是要比通常時序預測方法準確度提高很多了。
將來,咱們還會根據不一樣品類的消費特徵,分別給予不一樣的品類特徵日曆,進一步提高品類甚至SKU級別的預測準確度。同時,還能夠增長天氣做爲額外特徵,這樣對於一些極端天氣狀況下的銷售預測也會進一步提高準確度了。
具體到算法層面,爲何觀遠的AI智能預測算法可以比市面上通用的預測算法在預測準確度上再提高一個層級呢?
首先咱們來看通常時序預測工具中經常使用的ARIMA模型(Autoregressive Integrated Moving Average Model)。它是一種結合自迴歸與移動平均方法進行預測的模型,要求時序數據是穩定的,或者經過差分化後是穩定的,通常來講很難符合現實數據的狀況。與之相似的還有GARCH模型等傳統時序方法,大都只能進行單變量的建模,侷限性較大。
近年來涌現出更多複雜時序模型,以便解決實際業務中的複雜狀況。例如比較有表明性的TBATS的預測模型,結合了Box-Cox轉換,趨勢擬合,ARMA建模,週期性分析等複雜技術手段來進行建模預測。它其實是一種狀態空間模型(State Space Model)的算法實現,相似的還有隱馬爾可夫模型,RNN等也都屬於此類。這類模型主要限制是參數繁多,計算量大,在大規模時序預測時每每須要花費很大的計算成本實現。
那零售行業現實情況是怎樣的呢?咱們不妨先來看看零售數據自己具備的一些特徵:
趨勢特徵:通常銷售數據在一個比較長期的時間範圍內,具備總體增加或下滑的趨勢特徵。
週期特徵:銷售數據具備明顯的週期性和季節性。
非規律性的節假日特徵:節假日及節假日先後對銷售數據有顯著影響。
各種外部因素影響:促銷活動、天氣、搜索指數、銷售指標等因素也會顯著影響銷售數據。
數據稀疏性:通常零售行業的SKU,門店等維度的組合會很是巨大,但每一個組合中的時序數據數量每每比較有限。
基於直觀的理解,咱們就能夠發現簡單的ARIMA模型與複雜的狀態空間模型對於零售數據的預測都有必定的侷限之處。而觀遠數據則是根據具體的業務數據狀況,結合使用高效的廣義累加模型和狀態空間模型,統籌考慮零售時序數據的趨勢性、週期性,並加入對節假日及促銷、天氣等可預測波動因素的分析,給出綜合預測結果,能夠說這是一個專門爲零售預測而生的算法模型!
預測結果的可視化呈現
觀遠數據對預測數據呈現作了定向優化,對實際數據與預測數據進行了顏色和線型的區分,並添加了預測數據的置信區間,提供時間軸的縮略展現。
null
「AI預測引擎」數據展現
小結
本文給你們介紹了集成在觀遠BI平臺內的「AI預測引擎」功能的架構設計與算法實現方案,做爲觀遠數據今年重磅推出的新模塊,「AI預測引擎」不只僅引入了先進的AI預測算法,更將觀遠數據團隊多年與諸多500強企業合做中沉澱的、符合本土日曆特徵的零售數據預測經驗預置進了算法模型裏面,同時結合觀遠智能分析平臺,爲本土零售企業提供從數據接入、整理、預測到展示的端到端總體解決方案,感興趣的同窗歡迎點擊文末閱讀原文提交免費試用申請。
下一篇咱們將給你們介紹更多觀遠數據在AI領域的實際落地案例與應用效果,歡迎持續關注!