簡介: 數據的重要性在當今已經無需在多言,全部的企業都意識到數據的重要性,都但願利用數據來驅動業務的發展。可是,不少企業信息化管理者依然存在對於數據智能,數據驅動的一些誤解,這些誤解會讓企業的數據利用陷入深淵。算法
當咱們跟一些企業信息化管理者聊起應該儘早的考慮數據的利用,要對數據作總體規劃時,會常常聽到這樣一句話。數據庫
「我如今業務都還沒作起來,還不到考慮數據利用的時候」小程序
這一句話表明了很大一部分企業對於數據利用的認知,那就是,數據利用是從先有數據開始的,而數據是在應用建設以後存到數據庫裏的,因此先建設應用,而後等數據庫裏有了數據後,在考慮如何利用數據。網絡
聽上去,這個邏輯徹底正確。架構
可是其實這就是不少企業存在的首要的對於數據利用的誤區:」先建設應用,再考慮數據利用「。工具
若是用這樣的思路去建設,過了一年之後,每每這個企業就會馬上提出新的問題,「多個應用系統之間的數據不打通,不對齊,不一致,數據用不起來」。大數據
這個誤解,是根本上不充分理解數據利用的兩個本質:阿里雲
第一,數據是客觀存在的,不取決於你建不建設應用
一個企業,只要業務在運行,哪怕它沒有建設任何系統,它的數據都是在實時產生的,只是你沒有把它採集起來而已。人工智能
數據是業務在數字化世界裏的構成原子,業務流程和行爲會時刻產生各類數據,而不是必需要建設應用這些數據才產生的。舉個例子,當快遞員接到一個快遞訂單的時候,發件人,收件人,貨物類別,發貨地,發貨地,運輸工具類型,距離等這些數據就已經產生,而且會驅動這個快遞的走向。有沒有信息化系統的支持,只是改變了這些數據的記錄和傳遞的手段是一張紙仍是一個網絡而已。這些數據是客觀存在的,他不會由於信息化系統自己而改變。設計
咱們要從本質上認知到,數據是業務在數字化世界裏的投影模型,它是業務的鏡像,是客觀存在的。
只要有業務,那麼就存在對應的數據。應用只是把數據經過軟件採集到存儲設備裏而已。
第二,數據利用的規劃要早於應用和流程的建設
咱們在建房子以前,就要作總體設計,規劃出一棟大廈的各類利用場景,只有這樣纔不會出現一個不能被進入的房子。
如今,每一個企業都意識到,數據是企業的核心資產,應用是採集和利用這些資產的工具。爲了更好的在數據採集以後獲得充分的利用,每一個企業必需要在應用和流程的規劃以前,完成數據利用的規劃。
這就包括企業的數據資產目錄的規劃設計,企業的數據利用場景的規劃和數據的存儲,處理分析這些數據的技術平臺的需求規劃等。
Data First,在系統尚未建設的時候,作好了數據的藍圖規劃,完成了各個應用系統的數據分佈全景圖,企業就能規避數據孤島的存在。
因此,若是你如今尚未建設應用,那麼恭喜你,這是最好的規劃數據利用藍圖的機會,趕忙開始吧。
「咱們如今的數據不多,只能叫小數據,因此還談不上數據利用」,這也是一個典型的數據利用的誤解。
我第一次聽到這句話就是在B2B2C的零售企業。的確,傳統的經過經銷商爲主要渠道的品牌商,每每沒有創建本身的電商體系,因此最終消費者的行爲數據拿不到。他們有的就是Sell In的數據,而Sell In的數據每每量不大,而且維度很少,因此利用價值有限。
可是,如今的這個企業正在作的事情就是經過一個個的小程序,小應用,創建各類和終端消費者,客戶的觸點,從而獲取各種數據,單個的看都是小數據,量不大,維度也很少,可是,當這全部的點鏈接在一塊兒,就構成了一個豐富,多樣的用戶數據全景。
這個企業的業務負責人篤信,在數字化時代,誰擁有更多的數據場景,誰就可以擁有更強的競爭優點。
這個事例充分的說明,也許如今你的業務模式決定了你並無豐富的數據,可是,你依然要經過各類應用創新來多渠道,全方位獲取用戶,消費者的數據。而要建設什麼應用,獲取什麼數據,獲取的這些單個點狀數據間如何構成相互聯結,組合出數據場景價值呢?
這就是須要在構建應用以前有數據規劃,勾勒出一個數據場景地圖,從而沿着這個地圖去建設箇中小應用。
過去的應用系統被劃分爲OLTP和OLAP,在線交易型系統和在線分析型系統。因此,每每一看到這個應用自己是一個交易型的軟件,按照傳統的架構,那就是OLTP系統,因此每每不會用到一些OLAP的技術。
可是,目前的狀況則發生了巨大的變化。
拿約車調度系統來說,按照傳統的劃分,這是典型的交易系統,建立訂單,分配司機。可是,若是要可以支撐每秒幾萬單的調度分配,用手工分配的方式是不可能的,這個調度系統須要具備實時數據分析能力,而這裏麪價格肯定和路線的規劃的部分,又須要參考歷史的相關數據分析結果。這樣一來,這個典型的交易應用是被數據驅動的,它的底層和和核心實際上是批量數據分析和實時數據處理。
將來的全部的應用都會是這樣,那就是OLAP在支撐着OLTP系統的每個決策和行爲,從而成爲智能的應用。
數據技術正在逐漸重構全部的傳統流程類應用,讓他們成爲數據驅動的系統,從而變得更智慧。
一提到數據項目,不少人腦子裏第一個想到的就是算法模型,彷佛只有作研究的,作算法的,作人工智能的纔是作數據的。
因此,如今有一類觀點,認爲信息化產業裏分爲作算法的和作軟件的,而只有作算法的纔是作人工智能和數據的。
這是一個典型的誤解,將算法與軟件工程割裂開來。就像不久前,一個長期合做的客戶用一個固有印象,」思特沃克不是作人工智能的「,就否認了咱們的一個機會,這就是對於人工智能應用的誤解。
咱們用下面這張圖來體現算法和人工智能(數據科學)的關係。
人工智能的最底層是由各類算法組成的,可是,目前行業裏全部人使用的經常使用算法,都是公開的,而真正研究和產出這些算法的,是學術研究機構。
人工智能分爲兩個領域,一個是前沿研究領域,一個是應用領域。而做爲從事工業生產和商業運營的企業來講,須要的是後者。然後者最重要的是利用軟件工程能力將適合的算法應用到有價值的場景,從而去賦能業務。
在算法之上,人工智能的應用更重要的是充分的高質量的數據集,將算法和數據開發成爲良好用戶體驗的智能軟件的工程能力。
因此,優秀的作人工智能的企業除了擁有調優,調用公開的算法和代碼以外的能力更重要的是業務創新和軟件工程的能力。
經過逐個分析這四個對於數據智能的四個陷阱,咱們能夠得出以下啓示:
1、數據規劃應該優先於業務系統的建設,構建拉通的,一致的數據全景圖,避免應用之間的數據孤島
2、構建起數據全景圖後,在沿着這個地圖來構建一個個去採集填滿這些數據的小應用,從而構建本身的數據資產
3、全部的應用軟件都會被數據技術所賦能,成爲數據驅動的智能應用
4、人工智能應用於業務最重要的是場景創新能力和軟件工程能力
做者:智詢
本文爲阿里雲原創內容,未經容許不得轉載