阿里雲圖數據庫GraphDB上線,助力圖數據處理

GraphDB簡介
GraphDB圖數據庫適用於存儲,管理,查詢複雜而且高度鏈接的數據,圖庫的結構特別適合發現大數據集下數據之間的共性和特性,特別善於釋放蘊含在數據關係之間的巨大價值。GraphDB引擎自己並不額外收費,僅收取雲hbase費用。html

適合的業務場景
在以下多種場景中圖數據庫比其餘類型數據庫(RDBMS和NoSQL)更合適java

推薦及個性化
幾乎全部的企業都須要瞭解如何快速而且高效地影響客戶來購買他們的產品而且推薦其餘相關商品給他們。這可能須要用到雲服務的推薦,個性化,網絡分析工具。python

若是使用得當,圖分析是處理推薦和個性化任務的最有效武器,並根據數據中的價值作出關鍵決策。
舉個例子,網絡零售商須要根據客戶過往消費記錄及訂單推薦其餘商品給這個客戶。爲了能成功的達到目的,當前回話下用戶瀏覽操做等均可以實時集成到一張圖中。數據庫

圖很是適合這些相似的分析用例,如推薦產品,或基於用戶數據,過去行爲,推薦個性化廣告。跨域

電商商品推薦案例
如何使用GraphDB作商品實時推薦數組

安全和欺詐檢測
在複雜及高度相關的用戶,實體,事務,時間,交互操做的網絡中,圖數據庫能夠幫助檢測哪些實體,交易,操做是有欺詐性質的,從而規避風險。簡而言之,圖數據庫能夠幫助在數不清金融活動中產生的關係及事件組成的海量數據集中找到那根壞針。安全

某深圳大數據風控案例
客戶介紹:
該大數據有限公司專一於爲銀行、消費金融、三方支付、P2P、小貸、保險、電商等客戶解決線上風險和欺詐問題。網絡

案例背景及痛點
近幾年互聯網金融行業興起,誕生了不少互聯網金融企業,用戶參加線上貸款,金融消費,P2P融資等金融活動門檻大大下降,在這些金融行爲中如何有效規避風險,進行風控是每一個金融企業面臨的比較嚴峻的問題。用戶的金融行爲中會沉澱大量有價值的數據,在白騎士客戶小貸場景中會產生一筆筆貸款記錄關聯的手機號,身份證,銀行卡號,設備號等。這些數據表明一個個實體人,正常金融活動中,貸款,金融服務不是高頻行爲,一個實體人通常有一個惟一身份證,經常使用銀行卡號,手機號,設備號。這幾者頂點見不會產生高密度圖,但有一些高危低信用用戶可能會使用同一手機設備申請貸款進行騙貸。客戶痛點在於如何高效識別這些高危低信用用戶。架構

解決方案
創建圖模型
圖片描述運維

分別建立手機號,設備號,身份證,銀行卡號四類頂點及相互關聯的邊,擴展屬性便於查詢。從原數據倉庫清洗後經過graph-loader工具導入GraphDB

在線評估用戶信用資質
在申請貸款流程中,能夠經過使用圖庫能夠實時查詢圖中任意一手機號關聯的身份證數量(一跳/二跳查詢),惡意申請有以下特色,關聯子圖各種頂點過多,而且可能關聯上離線分析標註過得黑名單用戶,說明當前用戶存在惡意申請風險,實時拒掉貸款申請。下圖顯示如何與自身小貸平臺打通,作實時風控預警,箭頭方向表明數據流方向。
圖片描述

主動識別黑名單用戶
藉助spark graphframes分析能力,離線計算全圖中各個頂點出入度及pagerank,主動挖掘超級頂點,超級頂點如一個手機號關聯了多個身份證頂點,說明該用戶金融活動頻繁,背後的故事是一個實體人有多筆申請記錄,分別關聯了不一樣的身份證,手機號,說明該用戶在進行惡意欺詐活動,人工標註黑名單用戶,從源頭禁掉用戶金融活動。

物聯網
物聯網(IoT)是另外一個很是適合圖數據庫領域。 物聯網使用案例中,不少通用的設備都會產生時序相關的信息如事件和狀態數據。
在這種狀況下,圖數據庫效果很好,由於來自各個獨立的終端的流匯聚起來的時候產生了高度複雜性
此外,涉及諸如分析根本緣由之類的任務時,也會引入多種關係來作總體檢查,而非隔離檢查。

GraphDB特性
總體架構
PR3

使用Apache TinkerPop構建
GraphDB是Apache TinkerPop3接口的一個實現,支持Tinkerpop全套軟件棧,支持Gremlin語言,能夠快速上手。

在GraphDB中,爲應對不一樣的業務場景,數據模型已經作到儘量的靈活。例如,GraphDB中點和邊均支持用戶自定義ID;自定義ID能夠是字符串或數字;屬性值能夠是任意類型,包括map,數組,序列化的對象等。所以,應用不須要爲了適應圖數據庫的限制而作多餘的改造,只須要專一在功能的實現上面。

GraphDB具備完善的索引支持。支持對頂點創建label索引和屬性索引;支持對邊創建label索引,屬性索引和頂點索引;支持頂點索引和邊索引的範圍查詢和分頁。良好的索引支持保證了頂點In/Out查詢和根據屬性查找頂點/邊的操做都具備很好的性能。

與HBase深度集成
GraphDB使用企業認證的HBase版本做爲其持久數據存儲。 因爲與HBase的深度集成,GraphDB繼承了HBase的全部主要優點,包括服務可用性指標,寫/讀/時刻都在線高可用功能,線性可擴展性,可預測的低延遲響應時間,hbase專家級別的的運維服務。 在此基礎上,GraphDB加強了性能,其中包括自適應查詢優化器,分片數據位置感知能力。

使用spark graphframes作圖分析
藉助阿里雲HBase X-Pack提供的Spark產品,能夠對GraphDB中的圖數據進行分析。做爲優秀的大數據處理引擎,Spark可以對任意數據量的數據進行快速分析,Spark支持scala、java、python多種開發語言,可本地調試,開發效率高。此外,阿里雲HBase X-Pack的Spark服務經過全託管的方式爲用戶提供企業級的服務,大大下降了使用門檻和運維難度。Spark GraphX中內置了常見的圖分析操做,例如PageRank、最短路徑、聯通子圖、最小生成樹等。

雲上大規模GraphDB優點
全託管,全面解放運維,爲業務穩定保駕護航

大數據應用每每涉及組件多、系統龐雜、開源與自研混合,所以維護升級困難,穩定性風險極高。雲HBase GraphDB提供的全託管服務相比其餘的半托管服務以及用戶自建存在自然的優點。依託持續8年在內核和管控平臺的研發,以及大量配套的監控工具、跨可用區、跨域容災多活方案,GraphDB的底層核心阿里雲HBase提供目前業界最高的4個9的可用性(雙集羣),11個9的可靠性的高SLA的支持,知足衆多政企客戶對平臺高可用、穩定性的訴求。

使用阿里雲GraphDB
GraphDB引擎包含在HBase 2.0版本中,用戶在購買雲上HBase數據庫服務時,能夠選擇GraphDB做爲其圖數據引擎。GraphDB引擎自己並不額外收費,對於須要使用圖數據功能的用戶而言,將大幅下降應用和開發成本。

瞭解更多關於阿里云云數據庫HBase及圖引擎GraphDB請戳連接:

產品入口:

https://cn.aliyun.com/product...

幫助文檔:

https://help.aliyun.com/docum...

相關文章
相關標籤/搜索