本文轉載自 [https://www.jianshu.com/p/500448f810c5]程序員
Neo4j是一個高性能的,NOSQL圖形數據庫,它將結構化數據存儲在網絡上而不是表中。Neo4j也能夠被看做是一個高性能的圖引擎,該引擎具備成熟數據庫的全部特性。程序員工做在一個面向對象的、靈活的網絡結構下而不是嚴格、靜態的表中——可是他們能夠享受到具有徹底的事務特性、企業級的數據庫的全部好處。
Neo4j因其嵌入式、高性能、輕量級等優點,愈來愈受到關注。算法
在一個圖中包含兩種基本的數據類型:Nodes(節點) 和 Relationships(關係)。Nodes 和 Relationships 包含key/value形式的屬性。Nodes經過Relationships所定義的關係相連起來,造成關係型網絡結構。
數據庫
這類技術被稱爲圖數據庫,它們和「一般的」關係型數據庫世界中的聯機事務處理(Online Transactional Processing,OLTP)數據庫是同樣的。網絡
這類技術被稱爲圖計算引擎。它們能夠和其餘大數據分析技術看作一類,如數據挖掘和聯機分析處理(Online Analytical Processing,OLAP)。
圖數據庫通常用於事務(OLTP)系統中。圖數據庫支持對圖數據模型的增、刪、改、查(CRUD)方法。相應地,它們也對事務性能進行了優化,在設計時一般須要考慮事務完整性和操做可用性。
目前圖數據庫的巨大用途獲得了承認,它跟不一樣領域的不少問題都有關聯。最經常使用的圖論算法包括各類類型的最短路徑計算、測地線(Geodesic Path)、集中度測量(如PageRank、特徵向量集中度、親密度、關係度、HITS等)數據結構
經過圖分析能夠清楚地知道洗錢網絡及相關嫌疑,例如對用戶所使用的賬號、發生交易時的IP地址、MAC地址、手機IMEI號等進行關聯分析。
反欺詐已是金融行業一個核心應用,經過圖數據庫能夠對不一樣的個體、團體作關聯分析,從人物在指定時間內的行爲,例如去過地方的IP地址、曾經使用過的MAC地址(包括手機端、PC端、WIFI等)、社交網絡的關聯度分析,同一時間點是否曾經在同一地理位置附近出現過,銀行帳號之間是否有歷史交易信息等。
架構
圖數據庫能夠對各類企業進行信息圖譜的創建,包括最基本的工商信息,包括什麼時候註冊、誰註冊、註冊資本、在何處辦公、經營範圍、高管架構。圍繞企業的經營範圍,繼續細化去查詢企業究竟有哪些產品或服務,例如經過企業名稱查詢到企業的自媒體,從而給予其更多關注和了解。另外也包括對企業的產品和服務的數據關聯,查看該企業有沒有使人信服的自主知識產權和相關資質來支撐業務的開展。
企業在平常經營中,與客戶、合做夥伴、渠道方、投資者都會打交道,這也決定了企業對社會各個領域都廣有涉獵,呈現面錯綜複雜,所以能夠經過企業數據圖譜來查詢,層層挖掘信息。基於圖數據的企業信息查詢能夠真正瞭解企業的方方面面,而再也不是傳統單一的工商信息查詢。
性能