理資產、治數據,東軟一體化大數據治理
王遠前端
爲何須要數據治理?
大數據不是憑空而來,1981 年第一個數據倉庫誕生,到如今已經有了近 40 年的歷史,而國內數據平臺的建設大概從 90 年代末就開始了,從第一代架構出現,到如今已經歷了近 20 年的時間。
1
在這 20 年的時間裏,國內數據平臺實施者受盡折磨,交付數據項目是出了名的髒活累活。數據庫
忽視數據治理給數據平臺建設帶來了很多問題。隨處可見的數據不統1、數據質量差,以及難以完成的數據模型梳理等這些基礎性數據問題已經嚴重限制了數據平臺的發展,與此同時,數據應用在商業上難以嶄露頭角。
數據治理的難點痛點,概括有如下幾點:
數據採集難:數據的形態多樣化,給數據採集帶來很大難度,使得數據難以匯聚。
數據整合難:數據的來源多樣化,很難理清數據之間的關係,進而難以整合。
數據共享難:數據間壁壘高築,數據權限不明晰,使得數據沒法實現共享交換,難以推動數據的流通。
數據發現難:大量的IT系統,衆多廠商的參與,系統間數據標準不統一,很難找到真正須要的數據。
數據使用難:數據涵義不清晰,業務屬性不明確,數據難以利用,難以發揮出數據的價值。
數據監管難:少標準、缺規範,難以有效管理數據,難以保證數據的質量。
2
數據治理的對象
在 20 餘年的信息化建設中,不管是政府仍是企業都積累了大量的信息化資產。這些信息資產,從不一樣的維度,咱們把它分爲業務資產、技術資產、數據資產三部分,這些信息化資產貫穿數據的全生命週期。因此說,數據治理,不單單是治理數據自己,而是治理這些和數據全生命週期相關的信息化資產。
信息化資產包括內容
業務資產:業務資產指的是業務的術語,業務的規則,業務上的理解。
技術資產:技術資產存在於業務系統、數據庫服務器、文件服務器裏面,指的是技術設計類的資產。
數據資產:數據資產指全部的針對於數據庫表結構的設計、代碼表的設計及其相關數據。
對這三大類資產的管理過程,就是咱們常說的數據治理,具有又包含數據的權限責任管理、數據的規則管理、數據的質量管理、數據的安全管理等。
3
東軟大數據治理一體化解決方案
在 20 餘年的信息化建設過程當中,東軟經過諸多行業數據類項目的實施經驗的不斷積累,從元數據、主數據、數據標準、數據質量到數據處理、資源目錄、數據交換和數據安全,提供全面的數據治理解決方案,打通數據治理全流程,爲大數據應用構建提供支撐,同時,在各個領域豐富的解決方案實踐經驗也爲項目的成功提供了保障。安全
在數據治理的策略上,東軟採用先理後治的方案,實現數據標準化、流程規範化、治理常態化、價值可視化、監管智能化的數據治理。
東軟數據治理的「理」指的是統籌規劃,「治」指的是貫徹執行。
具體到內容上,「理」包括:
理系統:梳理已有業務系統、數據庫、文件存儲等信息,輸出數據鏈接,造成技術資產。
理數據:發掘數據表、文件、視頻、圖片等數據,描述數據的結構信息,造成數據資產。
理關係:分析表與表、文件與文件、系統與系統等關係,造成數據資產及資產間關係。
理標準:識別主數據、數據元、代碼、術語、規則等,造成業務、數據及管理資產。
理流程:規範上報數據、轉換清洗、標準變動流程,明確權責,造成業務及管理資產。
理目錄:整理資產清單,按照業務、技術等維度制定目錄,造成數據訪問同一入口。服務器
具體到流程上,「理」包含三種方式
理的目的是爲治,數據治理的第二階段是基於理出的標準規範貫徹執行。
治的具體內容包含
治匯聚:監管採集流程,整合多源數據,統一數據存儲,造成數據中心。
治質量:對齊標準及數據,基於數據標準對數據進行校覈,生成問題庫,造成質量報告。
治清洗:去除重複數據、補充不完整數據、修正錯誤數據,造成主數據。
治加工:發掘數據價值,轉化數據爲信息,對數據進行標籤處理,造成數據洞察。
治安全:識別敏感數據,明確責任人及權限,對數據進行分類分級,造成安全策略。
治共享:構築數據共享通道,提供數據訪問統一入口,造成自服務的共享平臺。
東軟大數據治理的目標
數據標準化
消除歧義,剔除重複
補全缺失,修正錯誤
統一碼錶,理清關係
流程規範化
規範數據生產,統一來源
規範數據變動,統一流轉
規範數據共享,統一出口
治理常態化
創建長效工程,按部就班
確立業務目標,小步快跑
樹立治理文化,長治久安
價值可視化
量化指標,價值可衡量
資產全景,價值可展示
全鏈分析,價值可跟蹤
監管智能化
數據操做留痕,可追溯
安全權責明晰,可監測
差別智能監測,可覺察
東軟大數據治理解決方案使用系統的方法來解決政府及企業現在所面臨的數據治理難題,提供一體化的解決方案,用來透明地管理全行業各種系統中龐雜的數據,造成一套標準、規範、準確、乾淨、完整的數據資產。架構
延伸閱讀大數據
SaCa Data Integration
數據集成套件(簡稱 SaCa DI 套件),是一系列數據整合產品集合。這些產品用於解決政府部門及企業現在所面臨的信息整合難題,提供一體化解決方案,並透明地管理當今企業各種系統中龐雜的數據,支持各類類型的業務系統數據的整合、交換和共享,從而幫助政府部門和企業造成一套乾淨、完整的數據集合。 SaCa DI 套件致力於爲客戶提供具備強大的實時數據採集、數據交換、數據轉換清洗、數據質量管理、數據比對、統一數據服務功能的平臺。 SaCa DI 套件針對面向企業單位及政府部門的數據資源開放共享、數據交換、數據分析等場景,提供數據目錄平臺,爲數據提供方與數據需求方提供統一數據平臺,並提供統一的註冊、發現、查詢、定位、獲取數據資源的入口。
東軟平臺產品
經過 UniEAP、SaCa、RealSight 產品的靈動組合,高效應對協做跨界融合、數據驅動業務、服務遍在按需、產品可信可控、平臺支撐敏捷的共性技術需求,支持便捷迅速的構建企業業務系統,實現業務從前端到後臺的變革,幫助企業實現智能化運營,從容應對市場變革,助力企業數字化轉型。目前,在政府、醫療、製造、電信、能源、教育、金融、交通等十多個行業領域應用擁有 3000 多家客戶、服務於近 10 億用戶。
網站:https://platform.neusoft.com
社區:https://plus.neusoft.com
熱線:400-655-6789網站