數據分析的第一步是準備數據,在準備數據的這個環節中,咱們一定會碰到元數據這個概念。元數據管理是數據管理中的一個重要方面,可是非業內人士,可能見到「元數據」這三個字,大概表情以下:
算法
做爲一個搞IT的我來講,表示很不理解:元數據難道就這麼很差理解嗎?數據庫
因而,咱們在公司小範圍內發起了一塊兒投票,看看你們對Yonghong BI產品裏的「刷新元數據」功能的理解狀況。
ide
然而,結果以下:
大數據
出乎個人意料,你們彷佛對元數據有不一樣的理解,要知道公司的小夥伴可都是那些來自985和211名校的同窗們。一場由「元數據」引起的血案,看來咱們有必要來澄清它。網站
維基百科中的解釋:Metadata is "data information that provides information about other data"。orm
各大中文網站的解釋:定義數據的數據。blog
So,咱們能夠意會一下,元數據就是用來描述數據屬性的信息的,能夠引伸一下,只要用來描述某個數據的,均可以認爲是元數據。數據分析
若是數據庫表裏存儲了電視劇的數據,那麼如下信息均可以認爲是電視劇的元數據。產品
用戶在使用數據時,能夠首先查看其元數據以便可以獲取本身所需的信息。Yonghong BI提供了獲取元數據、展現和管理元數據的界面,方便用戶進行元數據的查看和管理。it
當經過Yonghong BI訪問數據庫中的數據、大數據平臺中的數據或文本文件、Excel文件中的數據後,你須要作的,只是簡單一步:點擊「刷新元數據」來獲取元數據。若是數據庫中元數據有變化,好比列名、列別名、列類型等有變化,能夠點擊「刷新元數據」來獲取新的元數據。元數據界面以下:
Yonghong BI提供強大的元數據管理功能,這裏我再引伸一下,初步講講Yonghong BI裏的元數據管理。
用戶能夠在元數據區域對數據列進行默認屬性設置、數據權限設置、數據治理、數據查看、數據解釋等一系列可視化的動做,經過所見即所得的可視化方式幫助用戶有效瞭解和管理元數據。
一、視覺提示
Yonghong BI裏經過不一樣的Icon提示不一樣的信息。
二、維度和度量
Yonghong BI會根據數據類型和數據含義等因素,自動的將列分紅維度和度量。大多數狀況下,維度是離散的,而度量是連續的。度量一般是指標,即數字數據,例如「利潤」。維度一般是類別字段,例如「市場」和「地區」。因此數據類型爲文本、布爾、日期時間,默認爲維度;數據類型爲數值,默認爲度量。固然某些表達式,雖然是數值類型的,但它的數據已經離散化了,好比日期表達式的年和數據範圍字段,咱們也爲認爲是維度(這也是Yonghong BI簡單易用的一方面,瞭解你的業務,想你之所想
)。維度以其自己形態顯示在視圖上,度量以聚合形式顯示在視圖上,如:
維度和度量能夠調整,便可以將維度轉爲度量,和將度量轉爲維度。
三、別名和列備註
別名處能夠獲取數據庫裏定義好的別名,也能夠自定義別名。能夠對每一列加相應的備註信息,以對此元數據作更多的描述。
在可視化端進行數據綁定時,便可顯示列的備註信息:
四、數據類型
顯示數據類型,對於Excel和文本類型的數據集,能夠修改數據類型。
五、列屬性
能夠定義好數據的顯示格式和對數據應用脫敏規則,可視化端在視圖上會自動應用這些格式和規則。
六、可見性
能夠顯示和隱藏數據列。
七、列級權限
能夠按組、用戶、角色設置列的權限,控制哪些用戶對此列可見,哪些用戶對此列不可見。
八、分層數據
能夠新建層次,將不一樣維度數據列拖入層次裏,好比將省、市、縣三個數據列拖入層次,在可視化視圖層,能夠經過下鑽,上鑽等操做查看不一樣層次的數據。
九、分組數據列
將一系列數據列放入某個文件夾中進行管理,方便管理元數據,利於可視化層的用戶去綁定數據。
十、調整數據列順序
默認狀況下是按照拼音順序排的,能夠按需調整列的順序。
更多的數據治理
在元數據管理界面能夠對數據進行一系列數據查看、清洗和治理操做。
•轉換爲維度列
•轉換爲度量列
•新建分析算法
•新建層次
•新建日期層次
•新建表達式
•新建日期表達式
•新建數據範圍
•新建數據分組
•拆分數據列
•缺失數據填充
•去除數據空格
•值映射
•轉換爲數字列
•轉換爲日期列
•查看數據特徵值
•預覽數據
看到這裏,關於元數據,你們都瞭解了嗎?你理解的元數據又是什麼呢?歡迎你們在後臺留言與咱們互動。更多的數據治理功能介紹,咱們後續還會更新,敬請期待。