換個角度認識大數據(上)——何爲元數據

 什麼是元數據?網絡

要理解這個問題,首先要知道「元」是什麼。blog

元數據意味着「有關數據的數據」。雖然「meta」前綴(來自希臘語介詞和前綴 μετά-)意味着「以後」或「超越」,但它用於在認識論中表示「約」。元數據能夠爲數聽說明其元素或屬性(名稱、大小、數據類型等),或其結構(長度、字段、數據列),或其相關數據(位於何處、如何聯繫、擁有者)。索引

 

先讓咱們看一些真實的元數據示例:資源

 

一張照片書籍

 

每次用今天的相機拍照時,都會收集並保存一堆元數據:搜索

l  日期和時間,meta

l  文件名,數據類型

l  相機設置,im

l  地理位置。數據

 

一本書

 

每本書都有封面和內部的許多標準元數據。這包括:

l  一個標題,

l  做者姓名,

l  出版商和版權細節,

l  背面的描述,

l  目錄,

l  指數,

l  頁碼。

 

從這些真實的元數據能夠看出,元數據是關於數據的描述,存儲着關於數據的信息。

 

下面是契訶夫的小說《套中人》中的一段,描寫一個叫作瓦蓮卡的女子:

(她)年紀已經不輕,三十歲上下,個子高挑,身材勻稱,黑黑的眉毛,紅紅的臉蛋--一句話,不是姑娘,而是果凍,她那樣活躍,吵吵嚷嚷,不停地哼着小俄羅斯的抒情歌曲,高聲大笑,動不動就發出一連串響亮的笑聲:哈,哈,哈!

 

這段話裏提供了這樣幾個信息:年齡(三十歲上下)、身高(個子高挑)、相貌(身材勻稱,黑黑的眉毛,紅紅的臉蛋)、性格(活躍,吵吵嚷嚷,不停地哼着小俄羅斯的抒情歌曲,高聲大笑)。有了這些信息,咱們就能夠大體想像出瓦蓮卡是個什麼樣的人。

 

推而廣之,只要提供這幾類的信息,咱們也能夠推測出其餘人的樣子。

 

爲何會有元數據?

隨着網絡信息資源的指數級增加,用戶如何在浩瀚的信息海洋中找到真正所需的信息?爲了應對這種狀況,「元數據」做爲一個統一律念首次被提出。因特網的爆炸式的發展,令人們一時難以準確地找到本身所需的信息,人們就試圖模仿圖書館對圖書的管理方式,對網絡資源進行編目。

思考一下:若是你必須在最短期內快速準確找到在一百萬本書中的查到一本書,你會選擇哪一個選項?

一、經過書籍卡片目錄尋找

二、一本本尋找

大多數人會選擇經過圖書卡片目錄搜索,只要:

l  只須要知道卡片目錄上的ISBN號

l  知道ISBN號表明什麼

卡片目錄的主題索引是元數據集合,其有利於爲人們更方便地檢索信息提供了幫助。元數據至關於卡片目錄,存儲着關於數據的信息,爲人們更方便地檢索信息提供了幫助,在信息資源組織中扮演着描述、定位、搜尋角色,能夠幫助數據平臺解決「有哪些數據」、「數據存儲有多少」、「數據間的關係」、「如何找到我須要的數據」、「如何使用數據」和「數據的生產進度」問題。

相關文章
相關標籤/搜索