自從進入了移動互聯網時代,各類新事物出現的速度都好像坐上了宇宙飛船,幾乎隔幾天一個新概念。就拿數據庫而言,什麼Oracle、DB二、SQL Server、MySQL,這些你都得知道,而後是以MongoDB、HBase等爲表明的NoSQL數據庫,這幾年圖數據庫也很快流行起來,它是如此的熱門,以致於不趕忙學學好像無法跟你們交流了通常,雖然它也屬於NoSQL。node
練習完本文,大概須要20分鐘。web
圖數據庫,這是一個很容易被誤解的概念,好多人都下意識的覺得,這是存儲圖片的數據庫,其實否則。算法
傳統的關係型數據庫數據模型就是二維表,存儲時每一條記錄按行存儲;到了NoSQL,有些存儲的是文檔,如MongoDB中,有些存儲的鍵值對,如Redis,而圖數據庫,存儲的則是點邊關係。數據庫
所謂圖,回想離散數學、數據結構之類的基礎課,會想起它的定義,G = (V, E)
,簡單來講,一個圖有兩個必要的組成要素,點集合和邊集合,點的集合是爲點集,點之間的鏈接關係構成了邊集。典型的好比社交網絡,每個人均可以當作一個點,而他們之間的朋友關係,則能夠當作是邊。瀏覽器
爲何說圖數據庫這幾年很熱門,一個很重要的緣由多是,單一數據中的規律已經有太多的模型和算法能夠處理了,而好多隱藏的規律,則蘊含在數據之間的鏈接中。拿一個欺詐檢測中最典型的例子來講,好多不法分子申請信用卡,一個典型的特色是,他們會填寫好多相同的地址和電話,若是單純地分析信用卡申請單,很難判斷他們是否欺詐,但若是利用圖數據庫,以申請人和地址做爲點,以擁有某通訊地址爲邊構建圖,則很容易發現欺詐。(你們不要鑽牛角尖啊,我只是舉例說用圖數據庫很容易發現這種欺詐模式,並無說你不能用其餘的技術發現。)微信
還有一個傳統關係型數據庫和其餘NoSQL數據庫致命的弱點是,在一個圖(也有的資料叫網絡,這二者的區別之後有機會再解釋)中,尋找二度及以上的關係,效率很是低。相比你們都據說過「小世界」理論,也就是說,世界上的任何兩我的之間,只須要6我的就能夠創建聯繫,也叫六度分割理論,這只是個假說,後來有研究人員研究過Facebook等的數據發現,真實的值,比6還要小,大概在4左右,不得不感嘆,這個世界真小!言歸正傳,要想用關係型數據庫尋找6度關係,你們想一想那個計算量,簡直大得驚人,而使用圖數據庫,則簡單地多,由於它存儲的就是點邊關係,尋找幾度關係這類爲題,不過是圖的遍歷而已!網絡
通常這種新興軟件的安裝都很簡單,本文以macOS爲例,其餘平臺請參考官方文檔。數據結構
訪問https://neo4j.com/download/
,選擇For Individuals
(Community版,免費),下載相應平臺的安裝文件便可。學習
使用HomeBrew安裝一樣很是簡單code
$ brew install neo4j
使用以下命令啓動
$ brew services neo4j start
啓動後,打開瀏覽器,訪問http://localhost:7474
,便可看到Neo4j的web console,官方稱之爲Neo4j Browser
。使用neo4j/neo4j
分別做爲用戶名和密碼。登陸後會要求你更改用戶名和密碼
NOTE
萬一遺忘密碼,能夠到Neo4j的數據目錄下,刪除<Neo4j_database_location>/data/dbms/auth
,這樣下次登陸時會重置密碼。
啓動後界面相似下圖所示,作出的的邊欄我點開了,右側上方的命令條很重要,接下來的命令都要在此輸入,整個界面仍是比較易用的。
接下來介紹Cypher語句,這可謂是Neo4j的關鍵。
Cypher
語句是Neo4j的圖查詢語言。如下例子來自Neo4j Browser
,啓動後在命令欄輸入:play cypher
便可,能夠參照例子進行學習,也能夠參考本文練習。
在上方命令條中輸入以下語句
CREATE (ee:Person { name: "Emil", from: "Sweden", klout: 99 })
CREATE
是建立記錄的關鍵詞;()
指定一個節點;ee:Person
,ee是一個變量,Person是一個Label;{}
爲節點添加屬性
結果以下圖
MATCH關鍵詞能夠用於進行模式匹配(Pattern Matching),例如查找節點或者關係
MATCH (ee:Person) WHERE ee.name = "Emil" RETURN ee;
MATCH
節點或關係的匹配模式,相似SQL中的select;(ee:Person)
一個Label爲Person的單節點模式,匹配到的結果將賦值給變量ee;WHERE
對結果的約束,相似SQL中的where語句;ee.name = "Emil"
ee的屬性name是Emil;RETURN
請求特定結果。
MATCH語句不只能夠用於查詢節點,還能夠用於查詢關係,例如以下的語句
MATCH (ee:Person)-[:KNOWS]-(friends) WHERE ee.name = "Emil" RETURN ee, friends
在上面這條語句中
MATCH
語句描述了從已知節點到待尋找節點的模式;(ee)
是一個指代已知節點的變量;-[:KNOWS]-
匹配了KNOWS的關係(雙向匹配);(friends)
包含全部Emil的朋友
除了上面這種簡單的CREATE語句,還能夠組合其餘關鍵詞添加更復雜的記錄,我暫且叫它複合語句吧。
在上方命令條中輸入以下語句
MATCH (ee:Person) WHERE ee.name = "Emil" CREATE (js:Person { name: "Johan", from: "Sweden", learn: "surfing" }), (ir:Person { name: "Ian", from: "England", title: "author" }), (rvb:Person { name: "Rik", from: "Belgium", pet: "Orval" }), (ally:Person { name: "Allison", from: "California", hobby: "surfing" }), (ee)-[:KNOWS {since: 2001}]->(js),(ee)-[:KNOWS {rating: 5}]->(ir), (js)-[:KNOWS]->(ir),(js)-[:KNOWS]->(rvb), (ir)-[:KNOWS]->(js),(ir)-[:KNOWS]->(ally), (rvb)-[:KNOWS]->(ally)
執行結果顯示Added 4 labels, created 4 nodes, set 14 properties, created 7 relationships, completed after 13 ms.
使用PROFILE
或EXPLAIN
能夠用於分析Cypher語句,加深對查詢的理解
PROFILE MATCH (js:Person)-[:KNOWS]-()-[:KNOWS]-(surfer) WHERE js.name = "Johan" AND surfer.hobby = "surfing" RETURN DISTINCT surfer
模式匹配還能用來進行推薦。例如Johan正在學習衝浪,他想尋找一個新的已經在學習衝浪的朋友
MATCH (js:Person)-[:KNOWS]-()-[:KNOWS]-(surfer) WHERE js.name = "Johan" AND surfer.hobby = "surfing" RETURN DISTINCT surfer
能夠從結果看到,該語句找到一個Johan的朋友Alison
短短二三十分鐘,相信你已經大概瞭解了Neo4j,接下來還會介紹更加深刻的例子,結合客戶端驅動(如Python)操做Neo4j,同時還會在後期結合一個具體的例子講解Neo4j,感興趣的歡迎關注哦。同時,你們也能夠掃描二維碼關注個人微信公衆號哦。