首先,數據是有價值的。根據埃森哲發佈的「2035年以前各行業的平均GDP增加率」,單純看天然增加,製造行業只有2.1%,可是經過數據以及由此衍生出來的人工智能加成以後,這個數字就晉升到第二名4.4%,數據的價值是至關可觀的。安全
可是,數據的應用環境是有風險的。Facebook的我的隱私泄露事件,直接致使Facebook市值縮水640億美圓,扎克伯格也受到國會質詢。架構
此外,數據的應用環境是低效的。爲何數據的應用環境是低效的?一是數據不可知,用戶不知道本身有哪些數據,也不知道這些數據和業務有什麼關係,雖然意識到了大數據的重要性,可是沒有能解決本身業務所面臨問題的關鍵數據或不知該如何尋找這些數據。二是數據不可用,數據須要一個漫長的開發過程,致使業務分析的需求,難以被快速知足。三是數據不可控,沒有統一的數據標準致使數據難以集成統一,沒有質量控制致使海量數據難以被利用,沒有有效管理整個大數據平臺的管理流程。運維
從上面三點的分析,就得出了咱們數據治理的一個目標就是:合規、高效地產生數據價值。創建數據擁有者、使用者、數據以及支撐系統之間的和諧互補關係, 從全機構視角協調、統領各個層面的數據管理工做, 確保內部各種人員可以獲得及時、準確的數據支持和服務。工具
咱們認爲要合規、高效地產生數據價值必定不只僅是技術層面的事情,而是須要構建全生命週期、全深度、全方位的治理體系,包括數據治理組織體系、數據治理工具、數據治理管控流程三大層面。大數據
經過數據治理組織創建管理辦法、制定工做流程、肯定角色職責。數據治理工具主要包括數據標準管理、元數據管理、數據質量管理、數據資產管理、數據安全管理,各模塊協調運營,確保數據平臺的數據一致、安全、有效。數據治理管控流程貫穿整個數據治理體系的流程中,實現平臺化的數據管理思路。人工智能
數據治理組織的構建旨在經過創建數據治理組織架構,明確各級角色和職責,保障數據治理的各項管理辦法、工做流程的實施,推進數據治理工做的有序開展。3d
整個數據治理的組織結構能夠分爲三層:orm
1.數據治理委員會:數據管理的決策者。負責牽頭數據治理工做,制定數據治理的政策、標準、規則、流程,協調認責衝突。blog
2.數據治理中心:數據平臺的運營者。負責提交數據標準的要求及數據質量規則和業務規範,監督各項數據規則和規範約束的落地狀況,並負責數據治理中總體數據的管控流程制定。生命週期
3.各業務部門:數據提供者、數據維護者、數據消費者。負責具體執行事項。
數據治理管控流程是爲了讓方案能真正有序的落地,以數據標準制定爲例:
數據標準管理協調者組織數據提供者和執行者參與數據標準屬性的收集和整理工做,並按照企業實際狀況協商出數據標準初稿。
數據標準初稿進行屢次的討論和豐富後,造成數據標準審覈稿提交至數據標準管理決策者。
通過數據標準管理決策者的討論審覈後,由數據標準管理協調者再次進行數據標準的修改完善,並完成數據標準的發佈。
工欲善其事,必先利其器。數據治理管控工具是爲了幫助企業更好地將規範執行落地。一般認爲, 數據治理至少應當涵蓋以下功能域:數據資產管理、數據標準管理、元數據管理、數據質量管理、數據運維管理以及數據生命週期管理等。
• 數據標準:在數據治理組織架構推進和指導下,遵循協商一致制定的數據標準規範,藉助標準化管控流程得以實施數據標準化的整個過程。
• 元數據:採用集中式管理模式進行元數據管理,企業元數據邏輯集中,即元數據管理模塊做爲公司元數據的統一發布源,集中管理元數據,提供元數據集中建立、維護、查詢功能。
• 數據質量:對數據從計劃、獲取、存儲、共享、維護、應用、消亡等生命週期的每一個階段可能引起的各種數據質量問題,進行識別、度量、監控、預警等一系列管理活動,並經過改善和提升組織的管理水平使得數據質量得到進一步提升。
• 數據資產:規劃、控制、提供數據及數據資產的一組業務職能,包括開發、執行和監督有關數據的計劃、政策、方案、項目、流程、方法和程序,從而控制、保護、提升數據資產的價值。
• 數據安全:經過計劃、制定、執行數據安全政策和安全策略措施,爲企業數據提供行之有效的認證、受權、訪問和審計。
• 數據運維:包括數據資產運維、數據質量運維,可藉助運維工具來總體提高企業數據運維效率。
在數據資產價值被高度承認和開發利用的今天,數據治理不只僅須要做爲一項管理職能在企業內貫徹執行,也應該成爲一種企業文化。企業各層級的數據管理人員必須不斷地溝通、教育和推廣數據資產價值的重要性以及數據治理職能的業務貢獻。提高數據使用者對數據治理的意識及對數據治理效益的承認程度,是以持續改進企業數據管理機制,充分挖掘企業數據價值,提高企業核心競爭力。