什麼是元數據?網絡
要理解這個問題,首先要知道「元」是什麼。blog
元數據意味着「有關數據的數據」。雖然「meta」前綴(來自希臘語介詞和前綴 μετά-)意味着「以後」或「超越」,但它用於在認識論中表示「約」。元數據能夠爲數聽說明其元素或屬性(名稱、大小、數據類型等),或其結構(長度、字段、數據列),或其相關數據(位於何處、如何聯繫、擁有者)。索引
先讓咱們看一些真實的元數據示例:資源
一張照片書籍
每次用今天的相機拍照時,都會收集並保存一堆元數據:搜索
l 日期和時間,meta
l 文件名,數據類型
l 相機設置,im
l 地理位置。數據
一本書
每本書都有封面和內部的許多標準元數據。這包括:
l 一個標題,
l 做者姓名,
l 出版商和版權細節,
l 背面的描述,
l 目錄,
l 指數,
l 頁碼。
從這些真實的元數據能夠看出,元數據是關於數據的描述,存儲着關於數據的信息。
下面是契訶夫的小說《套中人》中的一段,描寫一個叫作瓦蓮卡的女子:
(她)年紀已經不輕,三十歲上下,個子高挑,身材勻稱,黑黑的眉毛,紅紅的臉蛋--一句話,不是姑娘,而是果凍,她那樣活躍,吵吵嚷嚷,不停地哼着小俄羅斯的抒情歌曲,高聲大笑,動不動就發出一連串響亮的笑聲:哈,哈,哈!
這段話裏提供了這樣幾個信息:年齡(三十歲上下)、身高(個子高挑)、相貌(身材勻稱,黑黑的眉毛,紅紅的臉蛋)、性格(活躍,吵吵嚷嚷,不停地哼着小俄羅斯的抒情歌曲,高聲大笑)。有了這些信息,咱們就能夠大體想像出瓦蓮卡是個什麼樣的人。
推而廣之,只要提供這幾類的信息,咱們也能夠推測出其餘人的樣子。
爲何會有元數據?
隨着網絡信息資源的指數級增加,用戶如何在浩瀚的信息海洋中找到真正所需的信息?爲了應對這種狀況,「元數據」做爲一個統一律念首次被提出。因特網的爆炸式的發展,令人們一時難以準確地找到本身所需的信息,人們就試圖模仿圖書館對圖書的管理方式,對網絡資源進行編目。
思考一下:若是你必須在最短期內快速準確找到在一百萬本書中的查到一本書,你會選擇哪一個選項?
一、經過書籍卡片目錄尋找
二、一本本尋找
大多數人會選擇經過圖書卡片目錄搜索,只要:
l 只須要知道卡片目錄上的ISBN號
l 知道ISBN號表明什麼
卡片目錄的主題索引是元數據集合,其有利於爲人們更方便地檢索信息提供了幫助。元數據至關於卡片目錄,存儲着關於數據的信息,爲人們更方便地檢索信息提供了幫助,在信息資源組織中扮演着描述、定位、搜尋角色,能夠幫助數據平臺解決「有哪些數據」、「數據存儲有多少」、「數據間的關係」、「如何找到我須要的數據」、「如何使用數據」和「數據的生產進度」問題。