語義網 (Semantic Web)和 web 3.0

語義網=有意義的網絡。php

「若是說 HTML 和 WEB 將整個在線文檔變成了一本巨大的,那麼 RDF, schema, 和 inference languages 將會使世界上全部的數據變成一個巨大的數據庫。」ios

--- Tim Berners-Lee, Weaving the Web, 1999git

=================

做者:顧軼靈
連接:https://www.zhihu.com/question/19965749/answer/13499141
來源:知乎
著做權歸做者全部,轉載請聯繫做者得到受權。

簡單說下個人見解。
傳統的 Web:之內容爲核心,網站負責提供各類內容 (新聞、小說、視頻等等) 吸引用戶,用戶主要是找到本身感興趣的內容後較被動地接受信息。

「Web 2.0」:之因此加引號,由於畢竟沒有所謂的 「Web 2.0 標準」。在普遍的共識中,Web 2.0 以用戶爲核心,用戶本身共享內容 (User-generated content,好比發表微博、博客文章、podcast、上傳視頻、圖片到 Youtube、Flickr 等等),Web 服務商提供各種 Web 應用來承載用戶的內容、組織他們之間的交互。相比傳統 Web,Web 2.0 的各類服務更專一於用戶,提供更好的交互體驗,同時各類服務商提供不一樣的開放 API,使得一些個性化 Web 應用的實現成爲可能。

「Web 3.0」:應該說 Web 3.0 這個說法究竟指什麼還沒能獲得普遍的共識,你們對其定義有不少不一樣的理解。
其中,較多人把語義網 (Semantic Web, ) 看做 Web 3.0。這是 WWW 之父 Tim Berners-Lee 提出的,對當前的 Web 內容組織方式能夠算是一種顛覆:目前互聯網上的信息絕大多數都是以 HTML 格式承載的,是將各個網站背後數據庫中隱藏着的結構化信息編碼爲瀏覽器可以渲染的 HTML 代碼 (在這過程當中瀏覽器並不知道網頁內容的真正含義,只知道如何渲染),最終渲染爲人類可讀的信息。這就有一個很是大的侷限:真正在互聯網上可以被共享的信息絕大多數都是半結構化的 HTML 內容,由於這些信息是海量的,要把它們整合利用必須經過自動化的手段,但機器又難以理解 HTML 中實際給人類閱讀的內容。因此如今各類天然語言處理、人工智能的方法被普遍應用於互聯網內容的處理,力圖讓機器可以還原各類數據之間的關係,更智能地加以組織利用 (這裏說的不是小說等天然語言文本,而主要是一些本來結構化的信息,在轉換爲 HTML 的過程當中丟失了原來的語義。例如電子商務網站上某個照相機的各項參數,機器很難準確識別一個網頁中哪些部分是用來描述這個相機的,而哪些又是廣告或是描述其餘產品的)。
而語義網的概念是從另外一個方向來解決這個問題:不用機器來作基於人工智能的識別,而是在提供內容的時候,就用明確的、機器可讀、有標準語義可依的方式來將所提供內容的語義描述清楚,創建完善的機制來描述互聯網上的各類資源。在資源的標準化描述之上,創建標準的語義推理以及信任體系,爲各類智能代理 (intelligent agent) 提供可靠的信息、標準化的交互模式,從而改變人們訪問 Web 的方式 (好比比 Siri 更爲強大且智能得多的應用,記得有個例子是當你牙疼要看牙醫,智能代理會自動檢查你的日程安排、尋找合適的有空的牙醫、與診所的代理進行自動登記,爲你安排出行)。

目前已經有幾項技術成爲了語義網的推薦標準 ( ),其中在 Unicode、URI、XML 等基礎設施層之上已經成爲標準的有:
  • RDF/RDFS,資源描述框架及基於此的一套詞聚集
  • OWL,Web 本體語言,用來在 RDF 之上提供基於本體的詞聚集
  • SPARQL,用於查詢 RDF 文檔
在這些層次之上,還有推理、信任等層尚未肯定的標準。
語義網可否最終發展成爲其願景所描述的狀態,還很難說。由於從目前來看,各類開放 API 已經能夠組織成甚爲豐富的 Web 應用,而像語義網願景中描述的能夠本身搜尋識別可用服務進行組合完成用戶需求的超級智能代理,顯得有些遙遙無期。此外,語義網的標準的推進也有很大難度,率先「擁抱」這些標準短時間內並不會給互聯網公司帶來多大的好處,且語義網的將來又被不少人看衰,最終結局會不會慘淡收場也還沒有可知。批評語義網的觀念太過理想化、認爲其徹底不可能成爲現實的人大有人在。

回到 Web 3.0,語義網只是其中一種說法,也有人把語義網稱爲 「Web 4.0」。其它觀點我的不太瞭解,也就留待其餘人補充吧。


至於盈利模式,能夠說目前互聯網上的主要盈利模式仍是廣告。Web 無論是幾點零,以前的模式也不是說就被取代了。好比說如今咱們有那麼多 Web 2.0 網站,可是提供內容服務的網站一樣能夠很紅火,人們照樣上新浪看新聞、上優酷看電視劇。只要用戶能看得見的地方,均可以經過廣告來得到利潤。此外還有電子商務,無論 Web 幾點零,經過交易老是能夠獲取利潤的,只是交易的交互模式可能發生改變。另一個途徑是提供收費服務 (好比提供雲計算服務、提供網遊等娛樂服務),這和電商相似,只是交易的內容不是實體。

=========================web

什麼是對於Web 3.0[1]

  對於Web 3.0的概念更是衆說紛紜,如把Web 3.0等同於基於瀏覽器的虛擬網絡操做系統Web OS,或等同於智能語義網,或等同於Web服務;有的提出Web 3.0是XML Web Services,屬於開放式OPenAPI(應用程序編程接口);Google則把雲計算看作是Web 3.0,(Google CEO Eric Schmidt在韓國首爾數碼論壇(Seoul Digital Forum)上,定義Web 3.0的概念):「Web 3.0是指集合衆多應用在一塊兒,並帶有如下特色:應用相對少,數據成雲狀分佈,應用能夠運行於任何設備上(電腦或者手機均可以),應用速度很快且能夠高度個性化設置,呈病毒化幾何數量級的分發(經過社會網絡電子郵件等)。數據庫

[ 編輯]

Web 3.0的特色

  1.Web 3.0的API(應用程序編程接口)是全球範圍的,也就是XMLWebServices;編程

  2.Web 3.0的速度達到10G,全部的應用都不用擔憂速度;瀏覽器

  3.Web 3.0是一個技術框架或操做系統。安全

[ 編輯]

Web 3.0的核心內涵

  爲了說明Web 3.0,咱們須要回顧Web歷史上的重要浪潮。它們不是嚴格按時間定義的,而是交叉重疊在一塊兒的。服務器

  1.Web l.0:任何人能夠交易。1.O是關於來自一些主要的公司,如:eBayAmazon和Google等。咱們一直認爲它們僅僅是網站,但它們其實是一些功能豐富、容易上手、擴展性強的應用程序,這些特性之前不多被普通消費者看到過。Web 1.0在今天依舊具備很大的推進力,而且將持續很長時間。網絡

  2.Web 2.0:任何人能夠參與。Web 2.0特色是用戶產生內容、合做化、社區化。表明性的事物就是:BlogWiki等。任何人能夠參與到內容的建立中。在You Tube上上傳一個視頻,在Flickr上上傳參加聚會的照片。全部這些都不須要專門的技術,僅僅須要鏈接上互聯網。參與改變了咱們對於內容的理解:內容不是固定在發佈者那裏,它是活動在任何地方的。

  3.Web 3.0:任何人能夠創新。Web 3.0經過改變傳統軟件行業的技術和經濟基礎來改變現有的一切。新的Web 3.0強調的是任何人,在任何地點均可以創新。代碼編寫、協做、調試、測試、部署、運行都在雲計算上完成。對於企業來講,Web 3.0意味着SaaS程序能夠比傳統的c—s軟件更快、更高效的開發、部署、升級。對於開發者來講,Web 3.0意味着他們須要建立一個理想的應用程序,所須要的僅僅是一個想法,一個瀏覽器。由於世界上的每個開發人員均可以訪問強大的雲計算,Web 3.0是全球經濟的推進力。

  從上述來看,咱們認爲:Web 3.0跟Web 2.0同樣,仍然不是技術的創新,而是思想的創新,是本體技術以及知識組織觀念在網絡空間中的延伸和深刻發展。Web 3.0的最大價值不是提供信息,而是提供基於不一樣需求的過濾器,每一種過濾器都是基於一個具體需求。若是說Web 2.0解決了個性解放的問題,那麼Web 3.0就是解決信息社會機制的問題,也就是最優化信息聚合的問題。因此,Web 3.0的核心內涵就是信息的高度整合和高度的智能化服務。

[ 編輯]

Web 3.0的結構[2]

  Web 3.0的佈局能夠劃分爲四個不一樣層面:API服務、聚合服務、應用程序服務以及被服務的客戶

  應用程序接口(API)服務。API服務是使Web 2.0運行的主服務器,而且將成爲Web 3.0的引擎。下面是一些例子:谷歌的搜索和AdWords API;Areazon.com的附屬API;大量的RSS源;衆多的功能服務,好比包含在StrikeIron網絡服務市場(strikeiron.com)(Wainewright 2005)裏的那些。這個基礎層最突出的特徵之一就是它是商品層。隨着Web 3.0逐漸成熟,將會產生一個近乎完美的市場,它將從最高容量的服務中擠出全部利潤

  聚合服務。這些服務是一種中介,經過將原始API服務以一種有用的途徑捆綁在一塊兒,來解決一部分定位上的困難。各類各樣的RSS聚合器和新興的網絡服務市場,如Strikelron服務都是很典型的例子。

  應用程序服務。最多、最持久的利潤應該出如今這一層。這些服務將不一樣於現有的企業應用程序種類,如CRMERP,而是做爲一種新型的複合應用程序,將多種服務的基礎功能集中起來,幫助用戶以一種靈活、直觀的方式達到目的。一個有望增加的領域的例-g-.是語音商務(voice commerce(v-commerce)),它涵蓋了語音識別的應用,該應用的目的在於使聲控服務,包括互聯網瀏覽和電子郵件提取成爲可能。

  被服務的客戶。在Web 3.0界面的設計中,客戶端邏輯發揮了重要的做用,可是用戶更但願掌握和控制Web 3.0的一些後臺的操做知識。

  從數十億份造成網絡的文件和將其整合在一塊兒的連接中,計算機科學家和愈來愈多的新公司企圖找到開發人類智力的新途徑。它們的目的是在現存的網絡系統之上增長一層含義,它將使現存網絡不像一份目錄而更像一個嚮導——甚至爲人工智能系統提供了基礎。爲了完成這種程度的人工智能,即機器可以思考而不是僅僅遵從指揮,研究者已經投入了半個多世紀的精力,但仍未成功。Web 3.0的一個主要技術是語義網絡。

[ 編輯]

Web 3.0的特徵分析

  做爲Web 2.0的替代物,Web 3.0仍然是創建在Web 2.0的基礎之上,而且實現了更加「智能化的人與人和人與機器的交流」功能的互聯網模式。筆者從信息媒體網絡化角度出發,概括總結了Web 3.0四個方面的主要特徵。

  1.微內容(widget)的自由整合與有效聚合

  Web 3.0將應用Mash—up技術對用戶生成的內容信息進行整合,使得內容信息的特徵性更加明顯,便於檢索。將精確地闡明信息內容特徵的標籤進行整合,提升信息描述的精確度,從而便於互聯網用戶的搜索與整理。同時,對於UGC(用戶原創內容)的篩選性過濾也將成爲Web 3.0不一樣於Web 2.0的主要特徵之一。互聯網用戶的發佈權限需通過長期的認證,對其發佈的信息作不一樣可信度的分離,可信度高的信息將會被推到互聯網信息檢索的首項,同時提供信息的互聯網用戶的可信度也會獲得相應的提升。

  最後聚合技術的應用將在Web 3.0模式下發揮更大的做用,TAG/RSS基礎聚合設施,漸進式語義網的發展也將爲Web 3.0構建完備的內容聚合與應用聚合平臺。將傳統意義的聚合技術和挖掘技術相結合,創造出更加個性化、搜索反應迅速、準確的「Web挖掘個性化搜索引擎」。

  2.適合多種終端平臺,實現信息服務的普適性

  Web 3.0的網絡模式將實現不一樣終端的兼容,從PC互聯網到WAP手機、PDA、機頂盒、專用終端,不僅應用在互聯網這一單一終端上。

  現有的Web 2.0只能經過PC終端應用在互聯網這一單一的平臺上。如今層出不窮的新的移動終端的開發與應用都須要新的技術層面和理念層面的支持。而Web 3.0將打破這一僵局,使得各類終端的用戶羣體均可以享受到在互聯網上衝浪的便捷。

  3.良好的人性化用戶體驗以及基礎性的個性化配置

  Web 3.0一樣以人爲本,將用戶的偏好做爲設計的主要考慮因素。Web 3.0在對於UGC篩選性過濾的基礎上同時引入偏好信息處理與個性化引擎技術,對用戶的行爲特徵進行分析,既尋找可信度高的UGC發佈源,同時對互聯網用戶的搜索習慣進行整理、挖掘,得出最佳的設計方案,幫助互聯網用戶快速、準確地搜索到本身想要的感興趣的信息內容,避免了大量信息帶來的搜索疲勞。

  個性化搜索引擎以有效的用戶偏好信息處理爲基礎,對用戶進行的各類操做以及用戶提出的各類要求爲依據,來分析用戶的偏好。經過偏好系統得出的結論再歸類到一塊兒,在某一內容主題(如體育方面)造成一種內容搜索的聚合、推送,達到更好地知足用戶搜索、瀏覽的須要。將這一技術引入到圖書館信息服務中來,將會給傳統圖書館服務帶來巨大的影響。個性化引擎的創建是以讀者偏好系統爲基礎,偏好系統的創建要全面並且與內容聚合相聯繫。有了對讀者必定的偏好分析,才能創建起完善的個性化引擎。

   4.有效和有序的數字新技術

  Web 3.0將創建可信的SNS(社會網絡服務系統),可管理VoIP(Voice over Internet Protocol)與IM(即時通信、實時傳訊),可控的Blog/Vlog/Wiki,實現數字通訊與信息處理、網絡與計算、媒體內容與業務智能、傳播與管理、藝術與人文的有序有效結合和融會貫通。

  Web 2.0模式下的網絡社交平臺,只是簡單地將人與人經過互聯網這一平臺鏈接起來。經過互聯網註冊在SNS的平臺上結交朋友這一途徑,並不能確保註冊信息的可靠性和有效性,並非每一次交際圈的擴展都會帶來相應的利益需求,這一過程進行下去的結果將會致使自己信息的外泄和零亂、不可靠信息的泛濫,這些都顛覆了人們想利用互聯網來擴展人際交往的初衷。這一問題在Web 3.0模式下,將經過對用戶的真實信息的核查與認證這一方式來解決。高可信度的信息發佈源爲之後交際圈的擴展提供了可靠的保障。與此同時,人們在交際的過程當中,也能夠更迅速地找到本身須要的人才,而且能夠徹底信任這些可信度高的用戶提供的信息,利用這些進一步擴展對本身的有利的交際圈。

  Web 3.0模式下可管理的VoIP與IM,一樣爲互聯網用戶的使用提供了方便快捷的服務方式。可信度越高、信用度越好的用戶發佈的信息將會被自動置頂,既提升了信息源發佈者的可信度,同時使得這些有用、真實的信息更快地出如今用戶的面前,發揮信息的最大效力,提升了信息的使用率,下降了信息查找的時間損耗。

  Web 3.0模式下可控的Blog/Vlog/Wiki,一樣也是爲了提升消息的利用率與查找信息的便捷度而生的。這些本來在Web 2.0模式下容許用戶隨意發佈的Blog/Vlog/Wiki會使得網絡上堆積大量雜亂無章的信息,爲用戶的搜索帶來極大的不便。由此,Web 3.0提出了「可控」這一律念,使得信息的發佈與使用鏈接起來,若是想搜索高可信度的信息,能夠點擊可信度高的用戶撰寫的Blog/Vlog/Wiki,實現可信內容與用戶訪問的對接。提供了可靠的保障。與此同時,人們在交際的過程當中,也能夠更迅速地找到本身須要的人才,而且能夠徹底信任這些可信度高的用戶提供的信息,利用這些進一步擴展對本身的有利的交際圈。

  Web 3.0模式下可管理的VoIP與IM,一樣爲互聯網用戶的使用提供了方便快捷的服務方式。可信度越高、信用度越好的用戶發佈的信息將會被自動置頂,既提升了信息源發佈者的可信度,同時使得這些有用、真實的信息更快地出如今用戶的面前,發揮信息的最大效力,提升了信息的使用率,下降了信息查找的時間損耗。

  Web 3.0模式下可控的Blog/Vlog/Wiki,一樣也是爲了提升消息的利用率與查找信息的便捷度而生的。這些本來在Web 2.0模式下容許用戶隨意發佈的Blog/Vlog/Wiki會使得網絡上堆積大量雜亂無章的信息,爲用戶的搜索帶來極大的不便。由此,Web 3.0提出了「可控」這一律念,使得信息的發佈與使用鏈接起來,若是想搜索高可信度的信息,能夠點擊可信度高的用戶撰寫的Blog/Vlog/Wiki,實現可信內容與用戶訪問的對接。

[ 編輯]

Web 3.0和語義網絡[2]

  在Web 3.0中有可能增長語義網絡。The Economist指出,語義網絡瀏覽器將很快投入使用,在這個瀏覽器上,人們能夠進行發佈數據、畫圖等活動。「朋友的朋友」網絡就是一個範例,在該網絡中,網絡社區中的個體以他們與朋友之間的連接的形式來提供本身的信息。語義網絡有助於可視化如此複雜的網絡並組織它們以加深對社區結構的理解。

  語義網絡(Semantic web)是網絡的進化延伸。在語義網絡中,網絡內容不只能夠用人類語言來表達,也能夠以一種能夠被智能計算機軟件代理理解、翻譯和使用,使得它們查找、分享和整合信息更加容易的形式來表達。這項技術起源於萬維網聯盟主席蒂姆·伯納斯一李對互聯網的見解,即互聯網是數據、信息和知識交換的共用媒介。語義網絡的核心包括一種哲學、一系列設計理念、相互協做的工做團體以及各類可用技術。

  Borland將語義網絡看做即將使用的Web 3.0的核心工具。Borland認爲Web 3.0的新工具(其中一些工具已經在幫助開發人員將複雜應用程序結合起來)將改進和自動化數據庫搜索,幫助人們選擇度假勝地,更有效地對複雜的財務數據進行分類。

[ 編輯]

基於Web 3.0的我的網絡中心平臺框架

  Web 3.0公用信息平臺記錄公用的信息類型,把Web 2.0時期對信息的引用和轉載,變成對信息ID的引用和轉載信息的記錄,這樣就實現了跨網站、平臺流動,而且分佈在各個地方的資源網站和我的中心平臺信息是交互的,而我的信息平臺上的信息是處於動態變化之中的(見圖2)。

  1.信息整合與交換

  中心內的信息能夠直接和其餘網站的信息進行交互,能經過第三方信息平臺同時對多家網站信息進行整合使用。經過內置的方法可以讓小工具和遠程服務或者站點進行數據交換,這意味着在同一個頁面上能夠同時享用多個站點的服務(包括郵件、股票信息、在線翻譯、天氣、遊戲、資訊等)。

  2.用戶在中心上擁有本身的數據,並能在不一樣的網站使用

  邁向Web 3.0的第一步是「數據網絡」這一律唸的體現,結構化數據集以可重複利用、可遠程查詢的格式公佈於網絡上,好比XMLRDF和微格式。最近SPARQL的發展爲網絡上以RDF方式配發的數據庫提供了一套標準化的查詢語言和應用程序接口。數據網絡讓數據契合和應用程序互用性更上新臺階,使數據像網頁同樣容易訪問和連接。在數據網絡時代,重點主要是如何以RDF的方式提供結構化的數據。全語義網時期會拓寬語義範圍,這樣結構化,半結構化甚至零散的數據內容(好比傳統的網頁、文檔等)都能以RDF和OWL語義格式的形式廣泛存在。能夠這樣說,「個人其餘電腦是一個數據中心」。

  3.徹底基於Web,用瀏覽器便可實現複雜的系統程序才具備的功能

  Web 3.0有兩個特性:一是數據和應用能夠所有存儲在網絡服務端,再也不須要在計算機上運行;二是在任何一臺電腦或終端上打開瀏覽器,就能進入屬於本身的世界。

  「將來是數據跟着你走,你買了一臺新的機器,不用擔憂把數據拷過來或裝新的應用軟件,一個瀏覽器一切的環境、內容、信息所有在你面前了。固然這不止是在PC上,將來用手機、電視或其餘的也能夠接觸這樣的信息。將來你在任什麼時候候、任何設備能夠看到你全部的信息、作你全部的應用,都通過一個瀏覽器。」

[ 編輯]

參考文獻

  1. 高路著.超越谷歌 全球網腦新商機.中國經濟出版社,2010.02.
  2. 2.0 2.1 特伯恩等著.電子商務導論 第2版.中國人民大學出版社,2011.06.

=========================

 

什麼是語義網?

semantic(語義的)這個詞指有意思的或與之相關的

語義網是一種使用能夠被計算機理解的方式描述事物的網絡。

  • 甲殼蟲樂隊是來自利物浦的著名樂隊。
  • 約翰.列農是甲殼蟲樂隊的成員之一。
  • 唱片 "Hey Jude" 是由甲殼蟲樂隊錄製的。

象這樣的句子能夠被人類理解。可是如何可以被計算機理解呢?

陳述是由語法規則構建的。一門語言的語法定義了構建該語言的陳述所需的規則。

這就是語義網的本質所在 - 以計算機應用程序能夠理解的方式描述事物。

語義網和網頁之間的連接沒有關係

語義網描述的是事物之間的關係(比方說 A 是 B 的一部分,而 Y 是 Z 的成員)以及事物的屬性(例如尺寸、重量、使用期限和價格等等)。

資源描述框架

RDF(資源描述框架,Resource Description Framework)是一種用於描述網絡上的信息和資源的的標記語言。

將信息至於 RDF 文件之中,這樣的話,這些信息就有可能被計算機程序("web spiders")從網絡中搜索、發現、攝取、篩選、分析和處理。

語義網使用 RDF 來描述網絡資源。

若是您但願學習更多關於 RDF 的知識,請閱讀咱們的《RDF 教程

如何使用語義網?

假若有關音樂、汽車、入場券(或者任何別的東西)的信息被存儲於 RDF 文件,智能網絡應用程序就會將信息從不一樣的源中進行攝取,並將其整合,而後以一個有意義的方式將信息提交給用戶們。

相似以下內容的信息:

  • 不一樣經銷商的汽車價格
  • 藥品信息
  • 航班時刻表
  • 工業備件
  • 書籍信息(價格、頁數、編輯、年份)
  • 某人是誰
  • 事件的日期
  • 軟件更新

語義網技術容易被理解嗎?

語義網不是快速發展的技術。

其學習曲線是緣由之一。RDF 是由那些擁有邏輯學和人工智能方面的學院背景的人們發展起來的。對於通常的開發人員的來講,它並非特別容易被理解。

RSS 是一種用於構建語義網應用的快速發展的語言。若是您但願瞭解更多 RSS 的知識,請閱讀咱們的《RSS 教程》。

在下面的教程中,咱們將專一於 RDF 的使用,以發現語義網的潛力所在。

請單擊下一章,您能夠看到一個簡單的語義網應用實例。

=======================================================

語義網。一個簡單的應用實例。

購買和出售二手車

假設某個語義網系統用於經過因特網管理二手車的銷售和購買。

該系統可能包括兩個主要的應用程序: 一個針對但願購買汽車的人羣 一個針對但願出售汽車的人羣

讓咱們把這兩個應用程序稱爲 IBA (I Buy Application) 和 ISA (I Sell Application)。

IBA - I Buy Application

但願購買汽車的人羣使用的 IBA 應用程序相似這樣:

I Buy Application (IBA)

在真實世界的應用程序中,您可能在第一次使用該程序時被要求標示本身的身份。您的 ID 將存儲在一個 RDF 文件中。您的 ID 會把您標示爲一個帶有名字、地址、電子郵件以及 ID 號的人。

當您提交查詢時,應用程序會返回一個待售汽車的列表,這個列表會按照年份、價格、位置和可用性進行排序。經過在 web 對 RDF 文件的搜索,此信息會不斷地從 web spider 返回。

ISA - I Sell Application

但願出售汽車的人羣使用的 ISA 應用程序相似這樣:

I Sell Application (ISA)

當您提交表單時,應用程序會向您請求更多的信息,並把您的 ID 和信息存儲在一個 RDF 文件中,以供 web 使用。

RDF 文件包含的信息相似:

  • 您的 ID: 姓名、地址、電子郵件、ID 號。
  • 您的出售條目: 類型、型號、圖片、價格、描述。

幕後

在幕後,這個 "ISA" 應用程序會建立一個帶有許多 RDF 指針的 RDF 文件。

它會建立一個指向帶有關於 person 信息的文件的指針,一個指向帶有關於 Volvo 和 Volvo 型號信息的文件的指針,一個指向帶有關於 Volvo 經銷商和出售者信息的文件的指針,等等。

RDF 指針是一種指向有關某事物的信息的指針(其實是 URL),相似知識數據庫。

有關於此的優勢在於您沒必要對您本人或汽車的型號進行描述。這個 RDF 應用程序會爲您對信息進行整理。

語義網將如何工做?

混亂?標準?咱們須要什麼?咱們在期待什麼?

由微軟,由 Google,仍是由 W3C 發展標準?

RDF 是關於數據的數據 - 即元數據。RDF 文件常常會描述其它的 RDF 文件。未來有可能把全部的 RDF 文件鏈接起來構建一個語義網嗎?

沒有人知道,可是總有人去嘗試。

語義網會依靠本身發展起來嗎?

咱們不認爲語義網會依靠本身發展起來。它須要第三方的協助才能成爲現實。

不太可能的是,您僅僅在因特網上發佈 RDF 文件,就可以出售您的汽車。

必須經過不少力量的參與,纔可以發展相似上面的 "ISA" 和 "IBA" 應用程序。一方爲全部的項目構建搜索引擎數據庫,另外一方則爲其開發標準。

多是 eBay,或 Microsoft,或 Google,也多是別的公司。可是總會有人去作。

不久,咱們就會看到基於 RDF 的市場。而有一天,您將可以使用標準化的 RDF 文件在 Web 上收集有關幾乎全部事物的信息。

它可能免費。也可能你不得不爲信息,或至少爲出售您的信息來付費。

在因特網上發佈信息將比過去更加容易。也許 RSS 語言(參閱咱們的 RSS 教程)會成爲不少問題的解決途徑。

請閱讀咱們的下一節 - 有關語義網這個話題的更多內容。

===================================================

這裏列出了一些有關語義網的話題。

語義網代理

語義網不是可供搜索的免費文本。如但願搜索或訪問語義網,咱們須要軟件的協助。

要使用語義網,咱們就須要 「語義網代理」 或 「語義網絡服務」。這些「代理」或「服務」會幫助咱們在語義網上找到正在尋找的東西。

編者注:「語義網代理」:"Semantic Web Agents",「語義網絡服務」:"Semantic Web Services"。

在語義網上,咱們可能會搜索這些信息:

  • 最便宜的機票
  • 適合個人汽車的裝飾
  • 書籍、電影或音樂
  • 天氣預報
  • 時間表和日程
  • 股票價格和匯率

在將來,要想在 Web 上找到任何信息,使用您的「語義網代理」就能夠了。

語義網安全

我能信賴語義網上的一個賣家嗎?我能信任語義網上的一個買家嗎?

要解決上述問題,我須要訪問更多 RDF 文件:

  • 信用卡信息
  • 銀行信息
  • 語義網記錄
  • 社會安全信息
Source Person ID Person Name Status
Citybank 11223344 John Smith trustworthy
VISA 11223344 John Smith trustworthy
Recorded 11223344 John Smith unknown
US Social Security 11223344 John Smith born 10-10-1962

經過使用相似的這些 RDF 文件,個人「語義網」代理就可以肯定可以咱們是否能信任我正在打交道的這我的。

(可以經過 eBay 和 Amazon 之類的因特網交易公司來提供記錄信息)

支付

要運營語義網,就必須開發支付手段。

易用的因特網「儲蓄存款」可能成爲此問題的解決方案。

「儲蓄存款賬戶」是一種只能接受存款的賬戶。它能夠爲因特網上的全部提供便利,只要獲得您的 ID(或者您的電子郵件地址,很相似 PayPal),任何人均可以把錢存入您的賬戶。

經過使用這種支付手段,每一個人均可以在因特網上公佈他們的銀行賬戶,並在不須要中間人的狀況下出售他們的汽車。

因特網銀行業務的將來會是什麼樣子呢?

OWL - 您的網絡詞典

情景

  1. 您須要賣一本書
  2. 您打開 OWL 代理
  3. 您在種類中輸入 「Book」
  4. 在新窗口中填寫關於書的信息
  5. 您填寫印在書上的 ISBN 號碼
  6. 您選擇「二手」,以及 "condition as new",並單擊返回
  7. 您的 OWL 代理會自動填寫其他的部分
  8. 做者、年份、頁數... 如今全部的信息都完整了
  9. 您的 OWL 代理已經蒐集好您須要出售的書籍的全部信息
  10. 最後,您點擊拍賣按鈕。

您能夠在咱們的 RDF 教程中學習更多的內容。

您的拍賣代理

  1. 您的拍賣代理打開了。
  2. 您填好了最低價格,而後點擊「提交」。
  3. 這樣,您的書籍就能夠在因特網上進行拍賣了。

=================================

Introduction to the Semantic Web

Introduction

The Semantic Web, Web 3.0, the Linked Data Web, the Web of Data…whatever you call it, the Semantic Web represents the next major evolution in connecting information. It enables data to be linked from a source to any other source and to be understood by computers so that they can perform increasingly sophisticated tasks on our behalf.

This lesson will introduce the Semantic Web, putting it in the context of both the evolution of the World Wide Web as we know it today as well as data management in general, particularly in large corporations.

Objectives

After completing this lesson, you will know:

  • How Semantic Web technology fits in to the past, present, and future evolution of the Internet.
  • How Semantic Web technology differs from existing data-sharing technologies, such as relational databases and the current state of the World Wide Web.
  • The three primary international standards that help define the Semantic Web.

Context

The World Wide Web was invented by Sir Tim Berners-Lee in 1989, a surprisingly short time ago. The key technology of the original web—from an end user's point of view, anyway—was the hyperlink. A user could click on a link and immediately (well, back then, almost immediately) go to the document identified in that link.

The following 6-minute video places that invention in the context of both what had come before—including libraries and low-level computer networks—and what came afterwards—including Web 2.0 phenomena such as Facebook and Twitter.

In summary, the great advantage of Web 1.0 was that it abstracted away the physical storage and networking layers involved in information exchange between two machines. This breakthrough enabled documents to appear to be directly connected to one another. Click a link and you're there—even if that link goes to a different document on a different machine on another network on another continent!

In the same way that Web 1.0 abstracted away the network and physical layers, the Semantic Web abstracts away the document and application layers involved in the exchange of information. The Semantic Web connects facts, so that rather than linking to a specific document or application, you can instead refer to a specific piece of information contained in that document or application. If that information is ever updated, you can automatically take advantage of the update.

This may appear at first to be a very subtle advantage, but it is one that will be illustrated in detail in the various lessons here at Semantic University.

Today's Lesson

How is the "Semantic Web" Different?

The word semantic itself implies meaning or understanding. As such, the fundamental difference between Semantic Web technologies and other technologies related to data (such as relational databases or the World Wide Web itself) is that the Semantic Web is concerned with the meaning and not the structure of data.

Note: Other semantic technologies include Natural Language Processing (NLP) and Semantic Search. We will compare these technologies in separate lessons.

This fundamental difference engenders a completely different outlook on how storing, querying, and displaying information might be approached.  Some applications, such as those that refer to a large amount of data from many different sources, benefit enormously from this feature.  Others, such as the storage of high volumes of highly structured transactional data, do not.

Understanding when it is a good idea and when it is not a good idea to apply Semantic Web technologies is one of the primary objectives of the Semantic University. These topics will be addressed in much more detail in future lessons.

What Standards Apply to the Semantic Web?

From a technical point of view, the Semantic Web consists primarily of three technical standards:

  • RDF (Resource Description Framework): The data modeling language for the Semantic Web. All Semantic Web information is stored and represented in the RDF.
  • SPARQL (SPARQL Protocol and RDF Query Language): The query language of the Semantic Web. It is specifically designed to query data across various systems.
  • OWL (Web Ontology Language) The schema language, or knowledge representation (KR) language, of the Semantic Web. OWL enables you to define concepts composably so that these concepts can be reused as much and as often as possible. Composability means that each concept is carefully defined so that it can be selected and assembled in various combinations with other concepts as needed for many different applications and purposes.

Though there are other standards sometimes referenced by Semantic Web literature, these are the foundational three.

One way to differentiate a Semantic Web application vs. any other application is the usage of those three technologies.  However, the Semantic Web has been called many things, such as Web 3.0 or the Linked Data Web. Some of these names carry great significance, even with regard to the technology stack, so we'll cover this topic in a separate lesson.

Conclusion

Semantic Web technologies as a whole have made tremendous strides in the last decade. Some highlights include:

  • The Open Linked Data movement has grown massively every single year and contains far more information than any single resource anywhere on the Web.
  • Massive organizations—such as Merck, Johnson & Johnson, Chevron, Staples, GE, the US Department of Defense, NASA, and others—now rely on Semantic Web technologies to run critical daily operations.
  • The Semantic Web standards—RDF, SPARQL, OWL, and others—were merely drafts in 2001, but they have now been formalized and ratified.

Truly, an entire industry has been born in the past ten years, complete with multiple trade shows on several continents, a growing user community, and active standards bodies.

That said, significant room for growth still can be found.

  • In spite of recent huge strides on the part of Schema.org, Facebook's Open Graph, and others, the vision of an entire Web of interoperable data has still not yet been realized.
  • In spite of significant early corporate adoption by a select few frontrunners, most companies have not yet started using (or are even unaware of the existence of) Semantic Web technologies.
  • The learning curve for using Semantic Web technologies is steep because few educational resources currently exist for users new to the concepts, and still fewer resources can be found that discuss when and how to apply the technologies to real world scenarios.
相關文章
相關標籤/搜索