經過激勵協做實現語義 Web 的弱中心化

本文由 SoLiD 中文社區 翻譯自: ruben.verborgh.org/articles/in…

我的隱私數據正在以一種史無前例的規模被大量使用,由此引起了 Facebook + Equifax、Google Plus 等大公司的隱私醜聞事件。去中心化只是個烏托邦,咱們不談去中心化,只談弱中心化。我的數據的弱中心化可讓普通人控制他們的數據(尤爲是網絡數據),語義網技術可讓數據集成變的更快。可是,對於弱中心化的數據處理須要更復雜的算法,由此須要更強大的算力。因爲不是中心化的數據處理中心,各個數據節點的處理能力更低(你是否想到了邊緣計算?)。本文介紹了一個願景,使用分佈式帳本進行數據處理協做,並激勵網絡中的各節點。經過利用全部節點的集體處理能力,咱們能夠尋求除了當前「集中式計算機房」外另外的替代方案,令人們可以在不影響功能的狀況下從新得到數據的全部權。web

經過弱中心化我的數據的存儲來從新得到數據的控制權

在過去的幾年裏,咱們目擊了網絡上我的數據史無前例的集中化。不管你贊成與否,大型社交媒體都在收集咱們的信息,並在其強大的數據處理中心存儲和分發這些信息。人們爲了獲取更好的服務,不得不將數據共享給軟件服務商。例如,在 Facebook 上,包含家庭成員的相冊會上傳進去。Equifax 和 Facebook 的嚴重隱私醜聞讓咱們看到了將大量數據集中在一處可能產生的風險。而從新得到對數據的控制權是萬維網發明人 Tim Berners-Lee 在 2017 年制定的三個主要挑戰中的兩個。算法

讓人們從新控制數據的方式是容許數據存儲在他們想存儲的任何地方,而這和他們想要使用的應用程序無關。這是 SoLiD 等計劃背後的核心思想:數據是分散的,是弱中心化的,每一個人均可以將數據存儲在本身的空間中,而且應用程序與數據分離,由於使用 A 應用程序建立的資源能夠被 B 應用程序讀取和修改。緩存

應用程序無權要求全部權,而是從分散的數據中心查詢數據

上圖是一個示例,能夠看到社交應用的數據源是由其餘應用程序建立的圖片或者會議事件。此外,經過從多個存儲位置查詢數據來構建社交推送,而無需事先集中收集數據,也是 SoLiD 的一個核心亮點。這樣,人們就能夠自由選擇他們的存儲提供商和他們的應用程序提供商,並能夠隨意轉移他們的數據。他們可讓應用程序,其餘人或公司在他們認爲合適的時候訪問其數據的特定部分,並在任何給定的時間點撤銷或限制該權限。這能夠實現真早的數據全部權和徹底控制。安全

因爲這種方式須要處理相同的數據,因此須要一份標準協議,這能夠經過 RDF、SPARQL 等語義網技術實現。開發者能夠經過選擇被普遍承認的本體來表示數據,每一個人均可以自由選擇他們的本體,而且因爲語義學的存在,推理能夠彌合本體間的差別。換句話說,關聯數據(Linked Data)的弱中心化特質和 RDFS 、OWL 的不協調性質很是適合 SoLiD 的目標。服務器

弱中心化的性能問題

與集中式計算中心相比,弱中心化的系統面臨着兩個問題:網絡

  1. 單個節點不只要解決更難的問題,所擁有的資源也更少;
  2. 因爲分佈式,弱中心化數據處理比集中式數據處理須要更多的計算能力和網絡帶寬;

此外,如今不少數據處理算法尚未爲弱中心化的數據處理作好準備。咱們舉一個簡單但實際的例子,構建具備 500 個朋友的社交網絡推送,在最壞狀況下須要執行對 500 個不一樣數據源的查詢,其中每一個人朋友將他們的數據存儲在不一樣的位置。最早進的 SPARQL 查詢引擎只須要查詢十幾回。相比之下,弱中心化的數據存儲將須要聯合查詢數百個小型數據集。數據源的選擇策略對於性能相當重要。架構

最後,經過查詢連接暴露我的數據存儲帶來了安全問題上的挑戰。聯合 SPARQL 查詢一般在私有網絡中進行測試。在公共 Web 上,SPARQL EndPoint 長期以來一直受到可用性問題的影響,不管是技術緣由仍是管理緣由,這些問題至少能夠經過我的數據的掌控權表現出不可忽視的風險。當數據在愈來愈多的節點上傳播後,咱們可能遇到嚴重的帶寬使用問題和查詢速度降低問題。分佈式

經過多方協做最大化性能

若中心化網絡具備特定資產:即便單個節點與大規模服務器集羣相比資源有限,但整體而言,這些節點具備更大的計算能力和帶寬。每一個單獨的我的數據存儲以及每一個客戶端(計算機、智能手機、平板電腦)都會使用本身的 CPU - 這些 CPU 在集中式環境中一般未獲得充分利用。若是咱們找到可讓這些節點協做的方法,咱們就能夠解決弱中心化網絡中的資源問題。若是咱們採起優化措施,例如在最接近數據的節點上執行計算工做(也就是所謂的「邊緣計算」),咱們就能夠抵消因爲弱中心而產生的算法複雜度提高。ide

咱們能夠把這種理念應用於應用程序的數據收集階段,在弱中心化網絡中,這至關於聯合查詢(從不一樣的數據存儲中心上查詢)。社交媒體一般包含重疊的人羣,所以任何人均可能成爲其餘人的聯繫人。因此,咱們能夠達成一個共識,也就是,若是你幫助我執行了個人查詢,我也能夠幫助你執行你的查詢。而後,咱們就能夠將更大的子查詢並行的委託給 10 個或 20 個節點,而不是將子查詢發送到例如 500 個節點。所以,咱們不是在服務器或客戶端徹底執行數據收集,而是經過網絡動態地從新分配查詢執行。性能

經過分佈式帳本提供激勵和信任

爲了實現可持續的協做,須要激勵節點充當網絡的貢獻者。不然,節點沒法肯定,若是它在空閒時幫助其餘節點,則其餘節點須要記錄此節點的優先級。可是,當建立激勵時,節點可能會產生不誠信問題,所以咱們須要一種信任機制來驗證工做是否正確完成。因爲在弱中心化網絡中不存在集中式的實體,咱們須要一種弱中心化的共識來創建這種激勵和信任。這能夠經過分佈式帳原本實現,它能夠跟蹤所執行的工做,從而得到其餘人的幫助。

一類分佈式帳本是區塊鏈,須要證實才能在帳本中添加內容。比特幣是以無心義計算而聞名,但較新類型的區塊鏈項目(好比 Filecoin)爲此引入了更有意義的計算。使用 Filecoin,人們能夠向其餘人安全的存儲和檢索他們的數據,而且複製證實和時空證實會確認數據始終存在。咱們一樣須要開發一個查詢證實結果,它既能夠捕獲所執行的工做,也能夠捕獲結果的正確性。

下面這張圖顯示了網絡中單個節點的架構體系。當一個查詢到達時,該節點肯定它願意接受的激勵和願意爲其餘人支付的激勵。在可能委派了一些工做並自行執行完成以後,它會保留數據的出處並生成結果的正確性證實。整個交易在區塊鏈上註冊,以便全部參與者都能得到獎勵。某些節點可能會提早計算常見查詢的部分結果,或者緩存常見數據以加快查詢速度。

網絡中的每一個節點都有一個查詢處理器,能夠本身執行查詢或把部分委託給其餘人。激勵模型會捕獲所須要的獎勵、出處和提供正確性保證。執行任務及其激勵措施會記錄在區塊鏈上。

預計影響

在目前的弱中心化語義數據網絡中,整個想法先於了市場發展。上面的一些示例只是說明了對我的數據查詢的委託,還能夠將其做爲其餘服務,好比將數據轉換爲不一樣本體的推理。全部這些應用程序都依賴於客戶端 CPU 在大多數時間屬於空閒狀態的原則,也就是說,當咱們不須要使用 CPU 時將其借給其餘人使用,當咱們 CPU 不夠用時能夠委託其餘人幫助咱們計算。

這份提案將對語義網技術的規模化成長產生巨大影響,尤爲是在缺少明確業務模型的狀況下。它爲弱中心化算法開闢了新的方向,並在語義網和「agent」代理理論指南創建了聯繫,同時還應用了經濟模型中的激勵措施。固然咱們還要注意隱私等問題,也許咱們能夠經過加密來保證安全。最重要的是,這個願景向大小玩家都勾畫出了一個面向 Web 的語義 Web 之路。

參考文獻

[1]Berners-Lee, T. (2017), 「Three challenges for the Web, according to its inventor」, World Wide Web Foundation, March, available at:webfoundation.org/2017/03/web….

[2]Mansour, E., Sambra, A.V., Hawke, S., Zereba, M., Capadisli, S., Ghanem, A., Aboulnaga, A., et al. (2016), 「A Demonstration of the Solid Platform for Social Web Applications」, inCompanion Proceedings of the 25thInternational Conference on World Wide Web, pp.223–226, available at:crosscloud.org/2016/www-ma….

[3]Buil-Aranda, C., Hogan, A., Umbrich, J. and Vandenbussche, P.-Y. (2013), 「SPARQLWeb-Querying Infrastructure: Ready for Action?」, inProceedings of the 12thInternational Semantic Web Conference, available at:aran.library.nuigalway.ie/handle/1037….

[4]Verborgh, R., Vander Sande, M., Hartig, O., Van Herwegen, J., De Vocht, L., De Meester, B., Haesendonck, G., et al. (2016), 「Triple Pattern Fragments:a Low-cost Knowledge Graph Interface for the Web」,Journal of Web Semantics, Vol.37–38, pp.184–206, available at:linkeddatafragments.org/publication….

[5]Nakamoto, S. (2008), 「Bitcoin: APeer-to-Peer Electronic Cash System」, available at:bitcoin.org/bitcoin.pdf.

[6]Filecoin: A Decentralized Storage Network, Whitepaper. (2017), , Protocol Labs, available at:filecoin.io/filecoin.pd….

[7]Grubenmann, T., Dell’Aglio, D., Bernstein, A., Moor, D. and Seuken, S. (2017), 「Decentralizing the Semantic Web: Who will pay to realize it?」, inProceedings of the Workshop on Decentralizing the Semantic Web, available at:ceur-ws.org/Vol-1934/co….

相關文章
相關標籤/搜索