風劍分享 | 只有數據最懂公司的痛點,指導企業決策走向

只有數據最懂公司的痛點,指導企業決策走向算法

圖一

在2018中國大數據高峯論壇上,數瀾科技CEO風劍分享了對數據資產化的理解、大數據平臺的建設、大數據落地過程當中的挑戰,以及數據應用在將來的機遇與挑戰。具體全文摘錄以下:架構

1、什麼是數據資產化

「數據資產化是數瀾一直秉持的概念並持續在作的事情」。app

風劍曾經在負責阿里巴巴集團大數據業務的時候,見過不少應用場景。他以爲目前大多數的人對數據的認知並不夠,也不能理解數據從哪裏來,有怎樣的價值,以及對將來業務的支撐在哪裏?ide

舉一個例子,若是咱們是一個手機加工廠,咱們擁有各個領域和類型的數據,且天天都在產出數據,但除了產出數據外,企業還但願數據可以直接做用於業務領域,優化業務效果。這就是認知上的差別,即數據到底能帶來什麼價值,把原始的數據,變成業務上可以使用的數據的過程就是數據資產化。oop

世界上全部的資產,只有數據資產是越用越有價值的。由於它的產生和業務之間是若即若離的關係,若是你不使用它,它就會變成了一堆數字,若是你常用它,那它就愈來愈有價值。大數據

咱們本身在實踐過程中有兩個關鍵的技術點:第一點是將數據打通整合。不少家企業都有不一樣廠家提供的幾十套業務系統,怎麼把這些數據,包括郵件、視頻、語音等給鏈接、打通是目前整個行業都在解決的問題。優化

第二點是在數據打通以後把這些數據真正有效的組成業務上可以看見的、可識別的、可以使用的數據,這是整個行業都在面臨的特別大的挑戰。操作系統

咱們把從數據打通到數據組織到數據標籤化,再到數據內部體系化的過程叫數據資產化。視頻

圖二

2、大數據平臺的搭建與應用

若是從另外一個角度舉一個有關數據資產化的例子,就能夠了解到平臺是如何搭建的。blog

如今的shopping mall都有探測技術,當顧客來了就會知道這個顧客是誰,這些數據是頗有價值的,但它們只是數據資產,並非數據資產化。什麼纔是數據資產化呢?當有人進出的時候,把這樣的行爲的人、物、場景的關係匹配,拉到歷史的維度上,刻畫到歷史的每個時間節點上,這就是一個基於時空維度產生的事件。在全部的時空維度上這個過程自己就是資產化,它可以帶來的結果就是一我的全部的行爲都出現了,好比這我的過去常常一我的到shopping mall吃飯、看電影、逛街。突然有一天變成了兩我的共同進出,又有一天這我的看完電影去了母嬰店,這就是一個場景下的數據資產化的過程。能夠看到原生的數據只有三個,可是所帶來的數據資產會豐富到幾百幾千幾萬個維度,甚至能夠刻畫出一我的買東西是貨比三家仍是猶豫不決的購物心理,從數據視角看起來,價值是巨大無邊的,這就是數據資產化。

咱們有一系列的方法論來支撐完成數據資產化,第一點須要把這些數據基於場景、基於時空維度串起來,不然就沒有參考價值了。

第二點咱們的大數據平臺數棲能夠對客戶的數據進行加工、開發、建模等,從業務平臺層面來說就是數據data-mapping,怎麼把mapping好的數據作成profile,就是把探測數據到人的整個維度作一個全系的畫像。這就是數據開發。

數據開發的過程不須要改變客戶的知識結構,也不須要改變以往的數據存儲結構,數棲平臺是一個全系的、全維度的數據開發平臺。有了這個還不夠,還要有大量的數據須要作成標籤體系,但怎麼能快速生成應用,目前仍是一個須要解決的問題。

好比作營銷,或者風控還多是作消費者洞察畫像的,咱們把這些叫作數據應用。咱們要作一個用戶畫像來洞察這些人是壞人仍是好人,利用的就是我的數據資產加數據技術,而後經過算法和模型計算,把這我的畫出來,這就是用戶畫像能力。咱們把這種能力封裝進入一個實體,稱之爲數據引擎。數據加數據技術構成了數據引擎,而後把各類數據引擎呈如今平臺裏面,客戶用的時候特別方便。

以風控引擎舉例,風控引擎裏有不少場景,好比金融、企業、我的等,數據引擎的應用能夠隨場景變化而變化,在場景裏把數據基於場景特徵進行收斂和聚焦,經過標籤加數據引擎快速生成應用。

有了開發平臺、數據引擎和自有的數據資產以後,還要打造一個數據應用平臺和服務平臺,這中間包含三項核心能力,包括data-mapping、data-profile、data-service。若是把這三點結合起來,一個數據平臺基本上就成型了。咱們整個平臺的構建也是依據這個數瀾自有的理論,把判斷的數據放進來,可以將時空及場景鏈接起來,基於開發平臺把它作成一套profile,再基於一套數瀾自有的數據技術把它分割成一些數據服務,不管是to B面向實體店鋪或者企業,仍是to C面向消費者,都有合適的應用場景,並最終經過數據平臺讓數據活起來、用起來,固然這是咱們一直想要實現的理想。

3、大數據的時光倒流理論

這裏的挑戰在於認知data-mapping,數據如何作mapping,實際上在於數據的認知。

咱們在作地產行業的數據服務時發現如何利用大數據提高業主的滿意度,這是一個很是須要數據認知的過程。

在你們想象中,提高業主滿意度特別簡單,經過業主有無投訴,有無報修等數據來作分析便可。可是傳統的滿意度分析中使用的都是單一的數據,爲業主滿意度提高帶來的價值特別有限。地產公司找到咱們時但願可以用大數據提高業主滿意度,那時候咱們提出一個假設,整個地產公司五大服務體,業主、物業公司、供應商、承建商、服務商。若是能把這五大主體之間的關係構建起來,那提高滿意度就能夠找到切入點了,好比帶着全家人看一套房子,一共五我的去看,三我的滿意,兩我的不滿意,到底是滿意仍是不滿意,這裏面是沒有量化的標準,也沒有對與錯之分。可是當我把這五個關係之間的實體構建起來,找到任何一個事件的相關數據,這個事件出發交點在哪裏,那咱們就能瞭解了。這就是咱們把這種事件驅動起來的能力—數據認知的能力。

舉個例子:好比我買了一個新房子,我不太滿意,我會打電話過去投訴而且報修不少問題。業主會在一個電話中把全部問題都描述清楚,這個過程會產生不少的非結構化的數據,好比業主是否有家人,有小孩,有老婆,有老人等,哪一個水龍頭漏水、進而關聯水龍頭是誰生產的、誰服務的、物業公司是誰、服務週期、供貨週期、服務質量等,把全部的數據都串起來之後就會知道這是一個批量問題,仍是個性化問題。

再舉個例子,好比業主說「你必須把馬桶給我往左移五公分」,物業公司就會說這個房子是精裝修交付的,全部的樓層,甚至整個小區都是這樣的。但業主爲何要移呢?他會說「我小孩的浴盆放不進去,你說要不要移?」物業可能會說那我給你移,可是這個工程特別巨大,這裏面給出的信息就是他有小孩,要放一個浴盆給小孩洗澡,這纔是問題產生的根結所在。數據要被深度的、多維的洞察,才能逼近事實本質,光靠採樣分析是發現不了這樣的問題。

我把這種能力稱之爲基於事件的mapping能力,大量的數據常常都是這樣。不斷地移動每個時間節點的事件,對到這個時間軸上而後抽取這類事件的共性數據,咱們把這種方法,總結稱爲時光倒流理論。

4、只有數據最懂你的公司

不少企業面臨着不知道本身的數據價值在哪裏,以及數據怎麼用的問題。這是數據的產品化應用問題,不少企業會想固然的作出來一個產品而後告訴客戶這個產品能夠解決哪些痛點。我跟數瀾的員工講,咱們任何人跟客戶談,儘可能不要給客戶講咱們的產品能解他的業務痛點,由於咱們不懂他的業務。地產行業客戶作了幾十年,他們業務的痛點不是咱們能夠很快了解的。可是數據能夠,數據最能懂公司的痛點,甚至判斷公司後續的決策方向。

就像我前面舉的例子,在作地產領域的時候,我把它們的投訴、工單信息打通以後,咱們能夠作到用大數據提高業主的滿意度,結果客戶發現本身還能夠作好多事情,好比資金管理,供應商能力管理,服務商管理等。業主滿意不滿意,只有數據可以知道,咱們把這個過程叫基於數據資產化的場景化驅動。咱們喜歡跟客戶講道理告訴他我不懂你的業務,可是你的數據能懂你的業務,若是你給我機會讓我把你的數據資產化,你基於這個數據資產來作數據業務的時候你會發現他的發揮的價值會很是高。

咱們先倒過來以客戶的業務作牽引,把客戶的數據所有資產化交付給客戶來知足客戶的業務場景。這種應用特別普遍,我舉一個標籤提示的數據資產給到他,他能夠作無數的數據資產應用來分析這個店鋪的流量都去了哪裏,它對個人貢獻有多大,哪一些作資產,哪一些作客戶分析,其實這裏仍是一個認知的問題。

我估計在將來兩到三年內,就是國內大部分大數據應用的最大障礙就是對數據的認知和場景化的認知問題。

5、數據應用創業須要聚焦

數瀾目前仍是會傾向於傳統公司,由於傳統公司作了幾十年、上百年後,他們很清楚本身短板在哪裏,應該付出什麼。咱們作客羣的時候只作傳統公司,地產,汽車,零售、化工,咱們都有涉及。

在數據時代的浪口,有不少的傳統公司遇上來了。互聯網時代不少東西他們已經完全錯過了,大數據時代它們不但願再錯過數據時代。不聚焦的公司初期能夠能還能夠,但到後面就會喪失競爭力。咱們目前主要聚焦在零售和地產,可是也許明年咱們的金融事業部就會成立。

6、數據時代是以場景爲驅動的

最近跟不少人討論過這個話題,咱們是這樣理解的,咱們如今會比較謹慎的提大數據,咱們把這個時代叫數據時代。在IT時代的時候,IBM也好、Oracle也好,那個年代全部的核心都是圍繞需求來驅動的,可是數據時代是以場景爲驅動的。

判斷一家公司是否是大數據公司就一個標準,你提供的產品是需求驅動仍是場景驅動,若是賣一個成熟的產品那就是典型的需求驅動,只能知足客戶的一部分需求。可是數據時代的到來就特別奇怪,它恰恰就是以場景做爲驅動的,你的數據產品能不能給我提供支撐,咱們選擇的時候也比較謹慎,咱們這兩天討論的有一個結論就是在數據時代的初期階段諮詢服務是特別重要的環節,就是一套理論一套方法論不斷地總結、討論,不斷地告訴他應該這樣作,纔可能慢慢地往數據操做系統層面走。

咱們認爲在將來的兩到三年可能會出現一個拐點,不少參考都是大數據諮詢業務佔優點,業務產品不管作得多好,都是單點業務之外的,包括AI的產品,風控產品作到極致。更大範圍仍是諮詢爲主,在將來的兩到三年。咱們有3331計劃,在將來的三到五年以內有一大波具備初級,就是通用型的數據產品會出來,它可能以拐點方式來驅動數據的應用,可是不知道這種數據是怎麼樣的,咱們也一直在探索這個數據形態。

關於風劍

數瀾科技創始人、董事長兼CEO,頂尖數據應用科學家、國際領先大數據理念的倡導者、國內大數據應用實踐的先行者。

甘雲鋒(風劍),中國國籍,數瀾科技創始人、董事長兼CEO。曾在華爲、金蝶、阿里巴巴擔任過數據架構師、數據科學家、數據業務負責人等職位。2012年即開始負責建立阿里集團最核心的數據互聯技術(ID-MAPPING)、數據資產體系(TCIF)、數據價值營銷系統(DMP)、城市智慧大腦(AI項目)等;沉澱國際領先的大數據思想及前沿技術研究,奠基大數據應用建設的基礎理論構架,並在此基礎上構建了國內首個較爲系統全面的大數據應用平臺; 2015年即做爲國內首批將大數據理念思想及大數據技術能力靈活應用到各專業領域特別是傳統行業的大數據應用實踐者,得到超過20多個行業領域客戶及資本市場的承認和青睞。

想要深刻了解大數據的小夥伴能夠加入數瀾社區唷,這裏有最全的數據中臺/可視化/Hadoop等相關文章~

相關文章
相關標籤/搜索