知識圖譜學習與實踐(1)——知識圖譜的演化過程

 1 引言web

知識圖譜是一個包含不少技術內容的知識體系,總的來講,是處理關聯的知識,核心是數據,但強調了數據之間的關聯關係。簡單來看,能夠認爲是數據庫或知識庫,和語義網有着千絲萬縷的聯繫。知識圖譜是由谷歌首先提出來的,用於優化它的搜索能力,以後,得到了蓬勃的發展,研究的人也愈來愈多。數據庫

知識圖譜的出現,不是一蹴而就的,有一個緩慢演進的過程,包括如今,也還在發展中。知識圖譜的發展,能夠從多個方面進行闡述,好比開放連接數據的思想,知識表示,知識推理,知識存儲等,伴隨着信息技術特別是人工智能技術的發展,知識圖譜不斷融合新的技術,不斷髮展和完善。此處主要講述知識圖譜理論的造成過程。網絡

2 信息機器Memexapp

1945年,一個美國科學家Vannevar Bush在《大西洋月刊》上發表了一篇文章《As We May Think》,提出一種信息機器的構想,就像下圖中的樣子。優化

在Bush博士的設想中,這種機器還能夠與圖書館聯網。經過某種機制,將圖書館收藏的膠捲,自動裝載到本地機器上。所以,只經過這一個機器,就能夠實現海量的信息檢索。他將這種機器命名爲Memex,也就是「memory extender」這兩個單詞詞首的組合,意思是「記憶的延伸」。搜索引擎

文中描述了對這種機器的設想,「Wholly new forms of encyclopedias will appear, ready-made with a mesh of associative trails running through them, ready to be dropped into the memex and there amplified.」人工智能

這個設想的影響很是大,後來許多早期的計算機論文中都提到了這個機器。而後,文中關於信息切換的描述,直接啓發了「超文本協議」(hypertext)的發明。如今,咱們在互聯網上不一樣的連接之間跳轉,其源頭均可以追溯到這篇文章。3d

3 以超連接爲主的WEBorm

1989年3 月,蒂姆·伯納·李爵士(Tim Berners-Lee)向CERN遞交了一份立項建議書,建議採用超文本技術(Hypertext)把CERN內部的各個實驗室鏈接起來,在系統建成後,將可能擴展到全世界。blog

 

 

在建議書中,有一段話以超文本爲核心的web,比利用層級結構的方式,更容易讓熱接受和傳播。

This is why a "web" of notes with links (like references) between them is far more useful than a fixed hierarchical system. When describing a complex system, many people resort to diagrams with circles and arrows. Circles and arrows leave one free to describe the interrelationships between things in a way that tables, for example, do not. The system we need is like a diagram of circles and arrows, where circles and arrows can stand for anything.

文中說明了超文本利用圓圈和箭頭能夠自由的描述任何事物,比使用層級結構的表格要靈活的多,特別是描述複雜系統,做用更加突出,這就是超文本的做用。這個思想也是如今比較流行的思惟導圖的核心思想,利用發散思惟,創建聯繫。

4 以連接數據爲核心的語義網

        語義網的概念也是由萬維網聯盟的蒂姆在1998年提出,它的核心是經過給萬維網上的文檔 (如:HTML文檔、XML文檔)添加可以被計算機所理解的語義「元數據」(外語:Meta data),從而使整個互聯網成爲一個通用的信息交換媒介。

語義網不一樣於如今WWW,現有的WWW是面向文檔而語義網則面向文檔所表示的數據,而語義網更重視於計算機「理解與處理」,而且具備必定的判斷、推理能力。

2006年蒂姆·伯納斯-李在普林斯頓大學演講和後期接受媒體採訪時公開表示,他最初將這種智能網絡命名爲語義網或許不夠貼切,也許更準確的名稱應該是數據網(外語:Data Web)。

 

 

5 谷歌知識圖譜,things, not strings

連接數據不斷積累,數據量以幾何量級增加,如何更好的使用這些數據,搜索引擎公司Google提出了知識圖譜的概念。辛格博士曾經說過,The world is not made of strings , but is made of things. 

知識圖譜的提出,目的在於更好的利用開放連接數據,將搜索字符串變爲搜索真實世界中的事物,將一個事物經過內部特徵(屬性)和外部聯繫(關係),立體的呈如今人們面前,將知識圖譜看做一張以關聯關係爲主的巨大圖譜,圖譜中,點表明客觀事物,邊表明了事物的屬性或關係。

 

6 結語

在知識圖譜的演進過程當中,還有不少思想和技術起到了很是大的做用,好比本體論,原本是哲學中的概念,被引入到知識圖譜中,用來指導知識表示,使得知識圖譜的知識表示更加規範,可以爲計算機所理解,在知識圖譜發展中起到了不可或缺的做用。

相關文章
相關標籤/搜索