一文了解阿里一站式圖計算平臺GraphScope

簡介: 隨着大數據的爆發,圖數據的應用規模不斷增加,現有的圖計算系統仍然存在必定的侷限。阿里巴巴擁有全球最大的商品知識圖譜,在豐富的圖場景和真實應用的驅動下,阿里巴巴達摩院智能計算實驗室研發並開源了全球首個一站式超大規模分佈式圖計算平臺GraphScope,併入選中國科學技術協會「科創中國」平臺。本文詳解圖計算的原理和應用及GraphScope的架構設計。

1、 什麼是圖計算

圖數據對一組對象(頂點)及其關係(邊)進行建模,能夠直觀、天然地表示現實世界中各類實體對象以及它們之間的關係。在大數據場景下,社交網絡、交易數據、知識圖譜、交通和通訊網絡、供應鏈和物流規劃等都是典型的以圖建模的例子。圖 1 顯示了阿里巴巴在電商場景下的圖數據,其中有各類類型的頂點(消費者、賣家、物品和設備)和邊(表示了購買、查看、評論等關係)。此外,每一個頂點還有豐富的屬性信息相關聯。node

圖 1:阿里巴巴電商場景圖數據示例python

實際場景中的這種圖數據一般包含數十億個頂點和數萬億條邊。除了規模大以外,這個圖的持續更新速度也很是快,每秒可能有近百萬的更新。隨着近年來圖數據應用規模的不斷增加,探索圖數據內部關係以及在圖數據上的計算受到了愈來愈多的關注。根據圖計算的不一樣目標,大體能夠分爲交互查詢、圖分析和基於圖的機器學習三類任務。git

一、 圖的交互查詢github

圖 2:左,金融反欺詐示例;右,圖學習示例。算法

在圖計算的應用中,業務一般須要以探索的方式來查看圖數據,以進行一些問題的及時定位和分析某個深刻的信息,如圖 2 (左)中的(簡化)圖模型可被用於金融反欺詐(信用卡非法套現)檢測。經過使用僞造的標識符,「犯罪分子」能夠從銀行得到短時間信用(頂點 4)。他嘗試經過商家(頂點3)的幫助,以虛假購買( 邊 2->3)來兌現貨幣。一旦從銀行(頂點4)收到付款(邊 4->3),商家再經過其名下的多個賬戶將錢(經過邊 3->1 和 1->2)退還給「犯罪分子」。這種模式最終造成一個圖上的閉環(2->3->1...->2)。真實場景中,圖數據在線上的規模可能包含數十億個頂點(例如,用戶)和數千億至萬億條邊(例如,支付交易),而且整個欺詐過程可能涉及到許多實體之間包含各類約束的動態交易鏈,所以須要複雜的實時交互分析才能很好的識別。數據庫

二、 圖分析編程

關於圖分析計算的研究已經持續了數十年,產生了不少圖分析的算法。典型的圖分析算法包括經典圖算法(例如,PageRank、最短路徑和最大流),社區檢測算法(例如,最大團/clique、聯通量計算、Louvain 和標籤傳播),圖挖掘算法(例如,頻繁集挖掘和圖的模式匹配)。因爲圖分析算法的多樣性和分佈式計算的複雜性,分佈式圖分析算法每每須要遵循必定的編程模型。當前的編程模型有點中心模型「Think-like-vertex」,基於矩陣的模型和基於子圖的模型等。在這些模型下,涌現出各類圖分析系統,如 Apache Giraph、Pregel、PowerGraph、Spark GraphX、GRAPE 等。後端

三、 基於圖的機器學習緩存

經典的 Graph Embedding 技術,例如 Node2Vec 和 LINE,已在各類機器學習場景中普遍使用。近年來提出的圖神經網絡(GNN),更是將圖中的結構和屬性信息與深度學習中的特徵相結合。GNN 能夠爲圖中的任何圖結構(例如,頂點,邊或整個圖)學習低維表徵,而且生成的表徵能夠被許多下游圖相關的機器學習任務進行分類、鏈路預測、聚類等。圖學習技術已被證實在許多與圖相關的任務上具備使人信服的性能。與傳統的機器學習任務不一樣,圖學習任務涉及圖和神經網絡的相關操做(見圖 2 右),圖中的每一個頂點都使用與圖相關的操做來選擇其鄰居,並將其鄰居的特徵與神經網絡操做進行聚合。安全

二 、圖計算:下一代人工智能的基石

不只僅是阿里巴巴,近年來圖數據和計算技術一直是學術界和工業界的熱點。特別是,在過去的十年中,圖計算系統的性能已提升了 10~100 倍,而且系統仍在變得愈來愈高效,這使得經過圖計算來加速AI和大數據任務成爲了可能。實際上,因爲圖能十分天然地表達各類複雜類型的數據,而且能夠爲常見的機器學習模型提供抽象。與密集張量相比,圖能提供更豐富的語義和更全面的優化功能。此外,圖是稀疏高維數據的天然表達,而且圖卷積網絡(GCN)和圖神經網絡(GNN)中愈來愈多的研究證實,圖計算是對機器學習的有效補充,在結果的可解釋性、深層次推理因果等方面將扮演愈來愈重要的做用。

圖 3:圖計算在AI各個領域具備廣闊的應用前景

能夠預見,圖計算將在下一代人工智能的各類應用中發揮重要做用,包括反欺詐,智能物流,城市大腦,生物信息學,公共安全,公共衛生,城市規劃,反洗錢,基礎設施,推薦系統,金融技術和供應鏈等領域。

三 、圖計算現狀

通過這些年的發展,已有針對各類圖計算需求的多種系統和工具。例如在交互查詢方面,有圖數據庫Neo4j、ArangoDB和OrientDB等、也有分佈式系統和服務JanusGraph、Amazon Neptune和Azure Cosmos DB等;在圖分析方面,有 Pregel、Apache Giraph、Spark GraphX、PowerGraph 等系統;在圖學習上有 DGL、pytorch geometric 等。儘管如此,面對豐富的圖數據和多樣化的圖場景,有效利用圖計算加強業務效果依然面臨着巨大的挑戰:

  • 現實生活中的圖計算場景多樣,且一般很是複雜,涉及到多種類型的圖計算。現有的系統主要是爲特定類型的圖計算任務設計的。所以,用戶必須將複雜的任務分解爲涉及許多系統的多個做業。在系統之間可能會產生大量例如集成、IO、格式轉換、網絡和存儲方面的額外開銷。
  • 難以開發大型圖計算的應用。爲了開發圖計算的應用,用戶一般使用簡單易用的工具(例如 Python 中的 NetworkX 和 TinkerPop)在一臺機器上從小規模圖數據開始。可是,對於普通用戶而言,擴展其單機解決方案到並行環境處理大規模圖是極其困難的。現有的用於大規模圖的分佈式系統一般遵循不一樣的編程模型,而且缺少單機庫(例如 NetworkX)中豐富的即用算法/插件庫。這使得分佈式圖計算的門檻太高。
  • 處理大圖的規模和效率仍然有限。例如,因爲遊歷模式的高度複雜性,現有的交互式圖查詢系統沒法並行執行 Gremlin 查詢。對於圖分析系統,傳統的點中心編程模型使圖級別的現有優化技術再也不可用。此外,許多現有系統也基本未在編譯器級別上作過優化。

下面咱們經過一個具體的示例看看現有系統的侷限性。

1 示例:論文分類預測

數據集 ogbn-mag 是一個來自於微軟學術的數據集。數據中包含四種類型的點,分別表示論文、做者、機構、研究領域;在這些點之間有表示關係的四種邊:分別是做者「撰寫」了論文,論文「引用」了另外一篇論文,做者「隸屬於」某個機構,和論文「屬於」某個研究領域。這個數據很天然的能夠用圖來建模。

一個用戶指望在這個圖上對 2014-2020 年間發表的「論文」作一個分類任務,指望能根據論文在數據圖中的結構屬性、自身的主題特徵、以及 kcore、三角計數 triangle-counting 等團聚度的衡量參數,將其歸類並預測文章的主題類別。實際上,這是一個十分常見和有意義的任務,這個預測因爲考慮了論文的引用關係和論文的主題,能夠幫助研究人員更好的發現領域內的潛在合做和研究熱點。

讓咱們分解一下這個計算任務:首先咱們須要對論文及其相關的點邊作一個根據年份的篩選,再須要在這個圖上計算 kcore、triangle-counting 等全圖計算,最後將這兩個參數和圖上的原始特徵一塊兒,放入一個機器學習框架進行分類訓練和預測。咱們發現當前已有的系統並不能很好的端到端解決這個問題,咱們只能經過將多個系統組織成一個 pipeline 的形式運行:

圖 4:論文分類預測多系統組成的工做流

這個任務看起來是解決了,實際上這樣流水線的方案背後隱藏着許多問題。例如多個系統之間互相獨立和割裂,中間數據頻繁落盤進行系統間的數據傳遞;圖分析的程序不是聲明性語言,沒有固定範式;圖的規模影響機器學習框架的效率等等。這些都是咱們在現實圖計算場景中常遇到的問題,總結一下能夠歸納爲如下三點:

  • 圖計算問題十分複雜,計算模式多樣,解決方案碎片化。
  • 圖計算學習難度強,成本大,門檻高。
  • 圖的規模和數據量大,計算複雜,效率低。

爲了解決以上的問題,咱們設計並研發了一站式開源圖計算系統:GraphScope。

四 、GraphScope 是什麼

GraphScope 是阿里巴巴達摩院智能計算實驗室研發並開源的一站式圖計算平臺。依託於阿里海量數據和豐富場景,與達摩院的高水平研究,GraphScope 致力於針對實際生產中圖計算的上述挑戰,提供一站式高效的解決方案。

GraphScope 提供 Python 客戶端,能十分方便的對接上下游工做流,具備一站式、開發便捷、性能極致等特色。它具備高效的跨引擎內存管理,在業界首次支持 Gremlin 分佈式編譯優化,同時支持算法的自動並行化和支持自動增量化處理動態圖更新,提供了企業級場景的極致性能。在阿里巴巴內部和外部的應用中,GraphScope 已經證實在多個關鍵互聯網領域(如風控,電商推薦,廣告,網絡安全,知識圖譜等)實現重要的業務新價值。

GraphScope 集合了達摩院的多項學術研究成果,其中的核心技術曾得到數據庫領域頂級學術會議 SIGMOD2017 最佳論文獎、VLDB2017 最佳演示獎、VLDB2020 最佳論文提名獎、世界人工智能創新大賽SAIL獎。GraphScope 的交互查詢引擎的論文也已被 NSDI 2021 錄用,即將發表。還有其它圍繞 GraphScope 的十多項研究成果發表在領域頂級的學術會議或期刊上,如 TODS、SIGMOD、VLDB、KDD 等。

一、 架構介紹

圖 5:GraphScope 系統架構圖

GraphScope 的底層是一個分佈式內存數據管理系統 vineyard[1]。vineyard 也是咱們開源的一個項目,它提供了高效和豐富的 IO 接口負責與更底層的文件系統交互,它提供了高效和高層次的數據抽象(包括但不限於圖,tensor,vector 等),支持管理數據的分區、元數據等,能夠爲上層應用提供本機零拷貝的數據讀取。正是這一點支持了 GraphScope 的一站式能力:在跨引擎之間,圖數據按分區的形式存在於 vineyard,由 vineyard 統一管理。

中間是引擎層,分別由交互式查詢引擎 GIE,圖分析引擎 GAE,和圖學習引擎 GLE 組成,咱們將在後續的章節中詳細介紹。

最上層是開發工具和算法庫。GraphScope 提供了各種經常使用的分析算法,包括連通性計算類、社區發現類和 PageRank、中心度等數值計算類的算法,後續會不斷擴展算法包,在超大規模圖上提供與 NetworkX 算法庫兼容的分析能力。此外也提供了豐富的圖學習算法包,內置支持 GraphSage、DeepWalk、LINE、Node2Vec 等算法。

二、 重解問題:論文分類預測

有了一站式計算平臺 GraphScope,咱們能夠用一種更簡單的方式解決前面示例中的問題。

GraphScope 提供 Python客戶端, 讓數據科學家能夠在本身熟悉的環境中完成全部圖計算相關的工做。打開 Python 後,咱們首先須要創建一個 GraphScope 會話。

import graphscope
from graphscope.dataset.ogbn_mag import load_ogbn_mag

sess = graphscope.sesson()
g = load_ogbn_mag(sess, "/testingdata/ogbn_mag/")

在上面的代碼中,咱們創建了一個 GraphScope 的 session,並載入了圖數據。

GraphScope 面向雲原生設計,一個 session 的背後對應了一組 k8s 的資源,該session 負責這個會話中全部資源的申請和管理。具體來講,在用戶這行代碼的背後,session首先會請求一個後端總入口 Coordinator 的 pod。Coordinator 負責跟 Python 客戶端的全部通訊,在完成自身的初始化後,它會拉起一組引擎 pod。這組 pod 中每個 pod 都有一個 vineyard 實例,共同組成一個分佈式內存管理層;同時,每個 pod 中都有 GIE、GAE、GLE 三個引擎,它們的啓停狀態由 Coordinator 在後續按需管理。當這組 pod 拉起並與 Coordinator 創建穩定鏈接、完成健康檢查後,Coordinator 會返回狀態到客戶端,告訴用戶,session 已拉起成功,資源就緒能夠開始載圖或計算了。

interactive = sess.gremlin(g)

# count the number of papers two authors (with id 2 and 4307) have co-authored
papers = interactive.execute("g.V().has('author', 'id', 2).out('writes').where(__.in('writes').has('id', 4307)).count()").one()

首先咱們在圖 g 上創建了一個交互式查詢對象 interactive。這個對象在引擎 pod 中拉起了一組交互式查詢引擎 GIE。接着下面是一個標準的 Gremlin 查詢語句,用戶想在這個數據中查看兩個具體做者的合做論文。這個 Gremlin 語句會發送給 GIE 引擎進行拆解和執行。

GIE 引擎由並行化 Compiler、內存和調度管理、Operator 運行時、自適應的遊歷策略和分佈式 Dataflow 引擎等核心組件組成。在收到交互式查詢的語句後,該語句首先會被 Compiler 拆分,編譯成多個運行算子。這些算子再以分佈式數據流的模型被驅動和執行,在這個過程當中,每個持有分區數據的計算節點都跑一份該數據流的拷貝,並行處理本分區的數據,並在過程當中按需進行數據交換,從而並行化的執行 Gremlin 查詢。

Gremlin 複雜的語法下,遊歷策略相當重要並影響着查詢的並行度,它的選擇直接影響着資源的佔用和查詢的性能。只靠簡單的 BFS 或是 DFS 在現實中並不能知足需求。最優的遊歷策略每每須要根據具體的數據和查詢動態調整和選擇。GIE 引擎提供了自適應的遊歷策略配置,根據查詢數據、拆解的 Op 和 Cost 模型選擇遊歷策略,以達到算子執行的高效性。

# extract a subgraph of publication within a time range
sub_graph = interactive.subgraph("g.V().has('year', inside(2014, 2020)).outE('cites')")

# project the projected graph to simple graph.
simple_g = sub_graph.project_to_simple(v_label="paper", e_label="cites")

ret1 = graphscope.k_core(simple_g, k=5)
ret2 = graphscope.triangles(simple_g)

# add the results as new columns to the citation graph
sub_graph = sub_graph.add_column(ret1, {"kcore": "r"})
sub_graph = sub_graph.add_column(ret2, {"tc": "r"})

在經過一系列單點查看的交互式查詢後,用戶經過以上語句開始作圖分析任務。

首先它經過一個 subgraph 的操做子從原圖中根據篩選條件抽取了一個子圖。這個操做子的背後,是交互式引擎 GIE 執行了一個查詢,再將結果圖寫入了 vineyard。

而後用戶在這個新圖上抽取了 label 爲論文的點和他們之間關係爲引用(cites)的邊,產出了一張同構圖,並在上面調用了 GAE 的內置算法 k-core 和三角計數 triangles 在全圖作了分析型計算。產出結果後,這兩個結果被做爲點上的屬性加回了原圖。這裏,藉助於 vineyard 元數據管理和高層數據抽象,新的 sub_graph 是經過原圖上新增一列的變換來生成的,不須要重建整張圖的所有數據。

GAE 引擎核心繼承了曾得到 SIGMOD2017 最佳論文獎的 GRAPE 系統[2]。它由高性能運行時、自動並行化組件、多語言支持的 SDK 等組件組成。上面的例子用到了 GAE 自帶的算法,此外,GAE 也支持用戶十分簡單的編寫本身的算法並在其上即插即用。用戶以基於子圖編程的 PIE 模型編寫算法,或者重用已有圖算法,而不用考慮分佈式細節,由 GAE 來作自動並行化,大幅下降了分佈式圖計算對用戶的高門檻。目前,GAE 支持用戶經過C++、Python(後續將支持 Java)等多語言編寫本身的算法邏輯,即插即用在分佈式環境。GAE 的高性能運行時基於 MPI,對通信、數據排布,硬件特徵作了十分細緻的優化,以達到極致性能。

# define the features for learning
paper_features = []
for i in range(128):
    paper_features.append("feat_" + str(i))

paper_features.append("kcore")
paper_features.append("tc")

# launch a learning engine.
lg = sess.learning(sub_graph, nodes=[("paper", paper_features)],
                  edges=[("paper", "cites", "paper")],
                  gen_labels=[
                      ("train", "paper", 100, (1, 75)),
                      ("val", "paper", 100, (75, 85)),
                      ("test", "paper", 100, (85, 100))
                  ])

接下來咱們開始用圖學習引擎爲論文分類。首先咱們配置將數據中論文類節點的 128 維特徵以及咱們在上一步中計算出的 kcore 和 triangles 兩個屬性共同做爲訓練特徵。而後咱們從 session 中拉起圖學習引擎 GIE。在拉起 GIE中 圖 lg 時,咱們配置了圖數據,特徵屬性,指定了哪一類的邊,以及將點集劃分爲了訓練集、驗證集和測試集。

from graphscope.learning.examples import GCN
from graphscope.learning.graphlearn.python.model.tf.trainer import LocalTFTrainer
from graphscope.learning.graphlearn.python.model.tf.optimizer import get_tf_optimizer

# supervised GCN.

def train_and_test(config, graph):
    def model_fn():
        return GCN(graph, config["class_num"], ...)

    trainer = LocalTFTrainer(model_fn,
                             epoch=config["epoch"]...)
    trainer.train_and_evaluate()

config = {...}

train_and_test(config, lg)

而後咱們經過上面的代碼選用模型以及作一些訓練相關的參數配置就能夠十分便捷的用 GLE 開始作圖分類任務。

GLE 引擎包含 Graph 與 Tensor 兩部分,分別由各類 Operator 構成。Graph 部分涉及圖數據與深度學習的對接,如按 Batch 迭代、採樣和負採樣等,支持同構圖和異構圖。Tensor 部分則由各種深度學習算子構成。在計算模塊中,圖學習任務被拆解成一個個算子,算子再被運行時分佈式的執行。爲了進一步優化採樣性能,GLE 將緩存遠程鄰居、常常訪問的點、屬性索引等,以加快每一個分區中頂點及其屬性的查找。GLE 採用支持異構硬件的異步執行引擎,這使 GLE 能夠有效地重疊大量併發操做,例如 I/O、採樣和張量計算。GLE 將異構計算硬件抽象爲資源池(例如 CPU 線程池和 GPU 流池),並協做調度細粒度的併發任務。

五 、性能

GraphScope 不只在易用性上一站式的解決了圖計算問題,在性能上也達到極致,知足了企業級需求。咱們使用 LDBC Benchmark 對 GraphScope 的性能進行了評估和對比測試。

如圖 6 所示,在交互式查詢測試 LDBC SNB Benchmark上,單節點部署的 GraphScope 與開源系統 JanusGraph 相比,多數查詢快一個數量級以上;在分佈式部署下,GraphScope 的交互式查詢基本能達到線性加速的擴展性。

圖 6:GraphScope 交互式查詢性能

在圖分析測試 LDBC GraphAnalytics Benchmark 上,GraphScope 與 PowerGraph 以及其餘最新系統比較,幾乎在全部算法和數據集的組合中居於領先水平。在某些算法和數據集上,跟其餘平臺比較最低也有五倍的性能優點。局部數據見下圖。

圖 7:GraphScope 圖分析性能

關於實驗的設定、重現和完整的性能比較能夠參見交互式查詢性能[3]和圖分析性能[4]。

六 、擁抱開源

GraphScope 的白皮書、代碼已經在 github.com/alibaba/graphscope 開源[5],項目遵照 Apache License 2.0。歡迎你們 star、試用,參與到圖計算中來。也歡迎你們貢獻代碼,一塊兒打造業界最好的圖計算系統。咱們的目標是持續更新該項目,不斷提高功能的完整性和系統的穩定性。

做者:開發者小助手_LS
原文連接本文爲阿里雲原創內容,未經容許不得轉載

相關文章
相關標籤/搜索