StartDT_AI_Lab | 開啓「數據+算法」定義的新世界

繼「數據中臺技術匯」欄目推出以來,得到了很多技術極客的喜好。做爲AI驅動的數據中臺創導者,深度關注核心算法技術的自研創新、融合探索,故推出全新AI算法欄目「StartDT_AI_Lab」,主要介紹算法團隊所承擔的角色與工做。本文先回顧這些年大數據之路,幫你們理解在奇點雲發展過程當中,人工智能技術是如何由業務需求孵化併成長爲產品一部分的,同時爲從此的分享內容作一個宏觀概述。算法

2013年,一本《大數據》成了很多技術人案頭必備的讀物。它像是一盞照燈,將數字世界的完整尺度忽然照亮,這時你們才意識到原來數字世界已經長如此大了。架構

從彼時起,大數據成了以後幾年最熱門的話題。隨之而出的各種概念,如「DT時代」、「雲計算」、 「DMP」等等,層出不窮。而其中的核心要素就是 「數據」 ,數據兩字彷佛已成爲技術界的圭臬。不少人將此次由大數據而帶起的技術革新浪潮譽爲「第四次工業革命」,而將數據比喻爲本次工業革命的 「石油」。恍惚間,很有 「得之則生,弗得則死」之意。隨後幾年,各家公司都掀起了「囤數據」運動,凡是能存入硬盤的,毫不刪除。「無論如今有用沒用,先存着,將來必定有用」的觀念,成了各家公司CIO、CDO們的指導思想。ide

然而,在「囤數據」運動方興未艾,正推着硬盤價格也一路上漲的發展進程中,卻有一個聲音如幽靈般飄來,並日漸響亮:數據無用!這聲音來自於這一運動中「出師未捷身先死」的烈士們,他們曾是「大數據」最忠實的擁躉,卻在數據價值的追尋中日趨迷茫,最終被「囤數據」、「開採數據」所帶來的成本飆漲壓垮。大數據

數據有用仍是無用,成了一個能夠討論的辯題。雙方各執一詞,誰也說服不了誰,共同在這DT時代吐出了這樣一句飽含憧憬卻無奈的嘆息:優化

若是你愛他,請給他數據,由於數據爲王。雲計算

若是你恨他,請給他數據,由於數據爲亡。人工智能

那麼數據到底有沒有用呢?不妨從奇點雲多年積累的數據經驗視角,咱們一塊兒來認真審視一下。視頻

若是隻是裸數據自己,可能確實是用處不大,正如汽車沒法經過灌注原油驅動同樣。進程

因此從數據中提取的信息纔有用是嗎?也不盡然,由於提取出來的信息大都支離破碎,並沒有法直接洞察商業情報。那麼從信息中組合分析得出的商業情報纔是價值點?還不夠,由於情報自己若是不能轉化爲決策去執行,再多的情報也沒法帶來收益。部署

那以情報爲依據,經過業務經驗分析判斷進行決策,是否就是DT時代的智能商業呢?還不完整,由於同一業務問題,解法是多元的,決策還需有效評估與優化迭代才能補全數據迴環。

如今,一幅比較完整的數據轉化利用的迴環已經造成,而這也是咱們的使命「讓商業更智能」背後的方法論。

StartDT_AI_Lab | 開啓「數據+算法」定義的新世界
有了這一方法論爲依歸,總體建設思路也就基本明晰了。目前你們在已有的文章中,已知道咱們的Simba和數據中臺,其在商業智能化迴環中的位置以下圖所示:
StartDT_AI_Lab | 開啓「數據+算法」定義的新世界

顯然,這一產品架構並無覆蓋整條商業智能化迴環。尤爲,從咱們的願景出發,幫助實體商家擁有淘寶同樣的數據化運營能力,其中很重要的一點是幫助實體商家把線下非數字化、非結構化的各種商業場景數字化、結構化並上雲,不然商業智能化迴環將沒法覆蓋實體商家的主要商業場景,所謂的商業效益的提高也就無從談起了。這其中缺失的即是本文介紹的重點,也是「StartDT_AI_Lab」的主體工做。爲了實現覆蓋實體商家全面商業場景的完整商業智能化迴環而特別研發的三大智能化引擎。其在產品架構中的位置以下:

StartDT_AI_Lab | 開啓「數據+算法」定義的新世界

如今簡單爲你們介紹一下這三大引擎。

視覺智能引擎,做爲數據入口,顯然是重中之重。其肩負着爲數字世界開疆拓土的重任,有點石成金,化水爲油之魔力。

在對其進行產品定義時,咱們主要從三個必然和兩個凡是對其進行了概念描述:

在戰略意義層面:

達成公司願景的必然前提。

·將實體商家線下場景進行數字化並上線。

線下場景在數字化改造中對於實施成本,部署難度,複製性,易用性等方面要求下的必然要求。

信息革命浪潮中的必然途徑。

·拓展互聯網,萬物互聯,所有在線。

在產品定義層面:

凡是實體商家數字化場景須要的。

凡是計算機視覺技術能夠發揮比較優點的。

在產品功能定義方面:

可回溯實時多級標籤策略

·基礎單元->單元屬性->行業行爲屬性->情報摘要,例如人爲一級標籤,穿着衣飾爲二級,是否 試穿某服裝爲三級,當天這件服裝試穿客戶的畫像分析是四級;

·有業務分析需求反向要求線下數字化;

視頻檢索

能夠回溯視頻檢索,例如要抽取二級標籤相關的信息,只須要根據一級標籤的時序、位置信息進行結構化升級和搜索便可;

Vision AI + X:從行業中來的特異性視覺模型

好比「雙偷模型」這樣的特異模型;

而關於商業洞察引擎和業務決策引擎,在以前的中臺欄目中已作過相關介紹,在此再也不贅述,只作一點補充。在兩個引擎中普遍使用的大數據分析和預測模型得益於視覺智能引擎提供的線下場景數字化後的結構數據,造成了一系列緊貼實體商家實際商業邏輯和經驗的特有的大數據模型。

從今日起,本欄目將圍繞這三大引擎,自下而上逐一介紹其建構中用到的各種型算法技術和背後的故事,敬請期待!

相關文章
相關標籤/搜索