圖數據庫初探之Neo4j

圖數據庫初試之Neo4j

自從進入了移動互聯網時代,各類新事物出現的速度都好像坐上了宇宙飛船,幾乎隔幾天一個新概念。就拿數據庫而言,什麼Oracle、DB二、SQL Server、MySQL,這些你都得知道,而後是以MongoDB、HBase等爲表明的NoSQL數據庫,這幾年圖數據庫也很快流行起來,它是如此的熱門,以致於不趕忙學學好像無法跟你們交流了通常,雖然它也屬於NoSQL。node

練習完本文,大概須要20分鐘。web

基本概念

圖數據庫,這是一個很容易被誤解的概念,好多人都下意識的覺得,這是存儲圖片的數據庫,其實否則。算法

傳統的關係型數據庫數據模型就是二維表,存儲時每一條記錄按行存儲;到了NoSQL,有些存儲的是文檔,如MongoDB中,有些存儲的鍵值對,如Redis,而圖數據庫,存儲的則是點邊關係。數據庫

所謂圖,回想離散數學、數據結構之類的基礎課,會想起它的定義,G = (V, E),簡單來講,一個圖有兩個必要的組成要素,點集合和邊集合,點的集合是爲點集,點之間的鏈接關係構成了邊集。典型的好比社交網絡,每個人均可以當作一個點,而他們之間的朋友關係,則能夠當作是邊。瀏覽器

爲何說圖數據庫這幾年很熱門,一個很重要的緣由多是,單一數據中的規律已經有太多的模型和算法能夠處理了,而好多隱藏的規律,則蘊含在數據之間的鏈接中。拿一個欺詐檢測中最典型的例子來講,好多不法分子申請信用卡,一個典型的特色是,他們會填寫好多相同的地址和電話,若是單純地分析信用卡申請單,很難判斷他們是否欺詐,但若是利用圖數據庫,以申請人和地址做爲點,以擁有某通訊地址爲邊構建圖,則很容易發現欺詐。(你們不要鑽牛角尖啊,我只是舉例說用圖數據庫很容易發現這種欺詐模式,並無說你不能用其餘的技術發現。)微信

還有一個傳統關係型數據庫和其餘NoSQL數據庫致命的弱點是,在一個圖(也有的資料叫網絡,這二者的區別之後有機會再解釋)中,尋找二度及以上的關係,效率很是低。相比你們都據說過「小世界」理論,也就是說,世界上的任何兩我的之間,只須要6我的就能夠創建聯繫,也叫六度分割理論,這只是個假說,後來有研究人員研究過Facebook等的數據發現,真實的值,比6還要小,大概在4左右,不得不感嘆,這個世界真小!言歸正傳,要想用關係型數據庫尋找6度關係,你們想一想那個計算量,簡直大得驚人,而使用圖數據庫,則簡單地多,由於它存儲的就是點邊關係,尋找幾度關係這類爲題,不過是圖的遍歷而已!網絡

安裝

通常這種新興軟件的安裝都很簡單,本文以macOS爲例,其餘平臺請參考官方文檔。數據結構

使用安裝文件安裝

訪問https://neo4j.com/download/,選擇For Individuals(Community版,免費),下載相應平臺的安裝文件便可。學習

使用HomeBrew安裝

使用HomeBrew安裝一樣很是簡單code

$ brew install neo4j

使用以下命令啓動

$ brew services neo4j start

啓動後,打開瀏覽器,訪問http://localhost:7474,便可看到Neo4j的web console,官方稱之爲Neo4j Browser。使用neo4j/neo4j分別做爲用戶名和密碼。登陸後會要求你更改用戶名和密碼

NOTE
萬一遺忘密碼,能夠到Neo4j的數據目錄下,刪除<Neo4j_database_location>/data/dbms/auth,這樣下次登陸時會重置密碼。

界面探索

啓動後界面相似下圖所示,作出的的邊欄我點開了,右側上方的命令條很重要,接下來的命令都要在此輸入,整個界面仍是比較易用的。

接下來介紹Cypher語句,這可謂是Neo4j的關鍵。

Cypher語句

Cypher語句是Neo4j的圖查詢語言。如下例子來自Neo4j Browser,啓動後在命令欄輸入:play cypher便可,能夠參照例子進行學習,也能夠參考本文練習。

CREATE

在上方命令條中輸入以下語句

CREATE (ee:Person { name: "Emil", from: "Sweden", klout: 99 })

CREATE是建立記錄的關鍵詞;()指定一個節點;ee:Person,ee是一個變量,Person是一個Label;{}爲節點添加屬性

結果以下圖

MATCH

MATCH關鍵詞能夠用於進行模式匹配(Pattern Matching),例如查找節點或者關係

MATCH (ee:Person) WHERE ee.name = "Emil" RETURN ee;

MATCH節點或關係的匹配模式,相似SQL中的select;(ee:Person)一個Label爲Person的單節點模式,匹配到的結果將賦值給變量ee;WHERE對結果的約束,相似SQL中的where語句;ee.name = "Emil"ee的屬性name是Emil;RETURN請求特定結果。

MATCH語句不只能夠用於查詢節點,還能夠用於查詢關係,例如以下的語句

MATCH (ee:Person)-[:KNOWS]-(friends)
WHERE ee.name = "Emil" RETURN ee, friends

在上面這條語句中

MATCH語句描述了從已知節點到待尋找節點的模式;(ee)是一個指代已知節點的變量;-[:KNOWS]-匹配了KNOWS的關係(雙向匹配);(friends)包含全部Emil的朋友

複合語句

除了上面這種簡單的CREATE語句,還能夠組合其餘關鍵詞添加更復雜的記錄,我暫且叫它複合語句吧。

在上方命令條中輸入以下語句

MATCH (ee:Person) WHERE ee.name = "Emil"
CREATE (js:Person { name: "Johan", from: "Sweden", learn: "surfing" }),
(ir:Person { name: "Ian", from: "England", title: "author" }),
(rvb:Person { name: "Rik", from: "Belgium", pet: "Orval" }),
(ally:Person { name: "Allison", from: "California", hobby: "surfing" }),
(ee)-[:KNOWS {since: 2001}]->(js),(ee)-[:KNOWS {rating: 5}]->(ir),
(js)-[:KNOWS]->(ir),(js)-[:KNOWS]->(rvb),
(ir)-[:KNOWS]->(js),(ir)-[:KNOWS]->(ally),
(rvb)-[:KNOWS]->(ally)

執行結果顯示Added 4 labels, created 4 nodes, set 14 properties, created 7 relationships, completed after 13 ms.

分析Cypher語句

使用PROFILEEXPLAIN能夠用於分析Cypher語句,加深對查詢的理解

PROFILE MATCH (js:Person)-[:KNOWS]-()-[:KNOWS]-(surfer)
WHERE js.name = "Johan" AND surfer.hobby = "surfing"
RETURN DISTINCT surfer

使用Cypher語句進行推薦

模式匹配還能用來進行推薦。例如Johan正在學習衝浪,他想尋找一個新的已經在學習衝浪的朋友

MATCH (js:Person)-[:KNOWS]-()-[:KNOWS]-(surfer)
WHERE js.name = "Johan" AND surfer.hobby = "surfing"
RETURN DISTINCT surfer

能夠從結果看到,該語句找到一個Johan的朋友Alison

小結

短短二三十分鐘,相信你已經大概瞭解了Neo4j,接下來還會介紹更加深刻的例子,結合客戶端驅動(如Python)操做Neo4j,同時還會在後期結合一個具體的例子講解Neo4j,感興趣的歡迎關注哦。同時,你們也能夠掃描二維碼關注個人微信公衆號哦。

相關文章
相關標籤/搜索