文檔解讀 | 關係型數據庫查詢語言 SQL 和圖數據庫查詢語言 nGQL 對比

摘要:這篇文章將介紹圖數據庫 Nebula Graph 的查詢語言 nGQL 和 SQL 的區別。node

本文首發於 Nebula Graph 官方博客:https://nebula-graph.com.cn/posts/sql-vs-ngql-comparison/mysql

sql-vs-ngql

雖然本文主要介紹 nGQL 和 SQL 的區別,可是咱們不會深刻探討這兩種語言,而是將這兩種語言作對比,以幫助你從 SQL 過渡到 nGQL。git

SQL (Structured Query Language) 是具備數據操縱和數據定義等多種功能的數據庫語言,這種語言是一種特定目的編程語言,用於管理關係數據庫管理系統(RDBMS),或在關係流數據管理系統(RDSMS)中進行流處理。github

nGQL 是一種類 SQL 的聲明型的文本查詢語言,相比於 SQL, nGQL 爲可擴展、支持圖遍歷、模式匹配、分佈式事務(開發中)的圖數據庫查詢語言。web

概念對比

對比項 SQL nGQL
\
\
點類型 \ tag
邊類型 \ edge type
點 ID 主鍵 vid
邊 ID 複合主鍵 起點、終點、rank
點或邊的屬性
點或邊

語法對比

數據定義語言 (DDL)

數據定義語言(DDL)用於建立或修改數據庫的結構,也就是 schema。sql

對比項 SQL nGQL
建立圖空間(數據庫) CREATE DATABASE <database_name> CREATE SPACE <space_name>
列出圖空間(數據庫) SHOW DATABASES SHOW SPACES
使用圖空間(數據庫) USE <database_name> USE <space_name>
刪除圖空間(數據庫) DROP DATABASE <database_name> DROP SPACE <space_name>
修改圖空間(數據庫) ALTER DATABASE <database_name> alter_option \
建立 tags/edges \ CREATE TAG | EDGE <tag_name>
建立表 CREATE TABLE <tbl_name> (create_definition,...) \
列出表列名 SHOW COLUMNS FROM <tbl_name> \
列出 tags/edges \ SHOW TAGS | EDGES
Describe tags/edge \ DESCRIBE TAG | EDGE <tag_name | edge_name>
修改 tags/edge \ ALTER TAG | EDGE <tag_name | edge_name>
修改表 ALTER TABLE <tbl_name> \

索引

對比項 SQL nGQL
建立索引 CREATE INDEX CREATE {TAG | EDGE} INDEX
刪除索引 DROP INDEX DROP {TAG | EDGE} INDEX
列出索引 SHOW INDEX FROM SHOW {TAG | EDGE} INDEXES
重構索引 ANALYZE TABLE REBUILD {TAG | EDGE} INDEX <index_name> [OFFLINE]

數據操做語言(DML)

數據操做語言(DML)用於操做數據庫中的數據。docker

對比項 SQL nGQL
插入數據 INSERT IGNORE INTO <tbl_name> [(col_name [, col_name] ...)] {VALUES | VALUE} [(value_list) [, (value_list)] INSERT VERTEX <tag_name> (prop_name_list[, prop_name_list]) {VALUES | VALUE} vid: (prop_value_list[, prop_value_list]) INSERT EDGE <edge_name> ( <prop_name_list> ) VALUES | VALUE <src_vid> -> <dst_vid>[@<rank>] : ( <prop_value_list> )
查詢數據 SELECT GO, FETCH
更新數據 UPDATE <tbl_name> SET field1=new-value1, field2=new-value2 [WHERE Clause] UPDATE VERTEX <vid> SET <update_columns> [WHEN <condition>] UPDATE EDGE <edge> SET <update_columns> [WHEN <condition>]
刪除數據 DELETE FROM <tbl_name> [WHERE Clause] DELETE EDGE <edge_type> <vid> -> <vid>[@<rank>] [, <vid> -> <vid> ...] DELETE VERTEX <vid_list>
拼接數據 JOIN |

數據查詢語言(DQL)

數據查詢語言(DQL)語句用於執行數據查詢。本節說明如何使用 SQL 語句和 nGQL 語句查詢數據。數據庫

SELECT
 [DISTINCT]
 select_expr [, select_expr] ...
 [FROM table_references]
 [WHERE where_condition]
 [GROUP BY {col_name | expr | position}]
 [HAVING  where_condition]
 [ORDER BY {col_name | expr | position} [ASC | DESC]]
GO [[<M> TO] <N> STEPS ] FROM <node_list>
 OVER <edge_type_list> [REVERSELY] [BIDIRECT]
 [WHERE where_condition]
 [YIELD [DISTINCT] <return_list>]
 [| ORDER BY <expression> [ASC | DESC]]
 [| LIMIT [<offset_value>,] <number_rows>]
 [| GROUP BY {col_name | expr | position} YIELD <col_name>]

<node_list>
   | <vid> [, <vid> ...]
   | $-.id

<edge_type_list>
   edge_type [, edge_type ...]

<return_list>
    <col_name> [AS <col_alias>] [, <col_name> [AS <col_alias>] ...]

數據控制語言(DCL)

數據控制語言(DCL)包含諸如 GRANTREVOKE 之類的命令,這些命令主要用來處理數據庫系統的權限、其餘控件。express

對比項 SQL nGQL
建立用戶 CREATE USER CREATE USER
刪除用戶 DROP USER DROP USER
更改密碼 SET PASSWORD CHANGE PASSWORD
授予權限 GRANT <priv_type> ON [object_type] TO <user> GRANT ROLE <role_type> ON <space> TO <user>
刪除權限 REVOKE <priv_type> ON [object_type] TO <user> REVOKE ROLE <role_type> ON <space> FROM <user>

數據模型

查詢語句基於如下數據模型:編程

RDBMS 關係結構圖

RDBMS

Nebula Graph 最小模型圖

Studio

本文將使用 NBA 數據集。該數據集包含兩種類型的點,也就是兩個標籤,即 playerteam ;兩種類型的邊,分別是 servefollow

在關係型數據管理系統中(RDBMS)中,咱們用表來表示點以及與點相關的邊(鏈接表)。所以,咱們建立了如下表格:playerteamservefollow。在 Nebula Graph 中,基本數據單位是頂點和邊。二者均可以擁有屬性,至關於 RDBMS 中的屬性。

Nebula Graph 中,點之間的關係由邊表示。每條邊都有一種類型,在 NBA 數據集中,咱們使用邊類型 servefollow 來區分兩種類型的邊。

示例數據

在 RDBMS 插入數據

首先,讓咱們看看如何在 RDBMS 中插入數據。咱們先建立一些表,而後爲這些表插入數據。

CREATE TABLE player (id INT, name VARCHAR(100), age INT);
CREATE TABLE team (id INT, name VARCHAR(100));
CREATE TABLE serve (player_id INT, team_id INT, start_year INT, end_year INT);
CREATE TABLE follow (player_id1 INT, player_id2 INT, degree INT);

而後插入數據。

INSERT INTO player
VALUES
   (100, 'Tim Duncan', 42),
   (101, 'Tony Parker', 36),
   (102, 'LaMarcus Aldridge', 33),
   (103, 'Rudy Gay',32),
   (104, 'Marco Belinelli', 32),
   (105, 'Danny Green', 31),
   (106, 'Kyle Anderson', 25),
   (107, 'Aron Baynes', 32),
   (108, 'Boris Diaw', 36),
   (109, 'Tiago Splitter', 34),
   (110, 'Cory Joseph', 27);

INSERT INTO team
VALUES
   (200, 'Warriors'),
   (201, 'Nuggets'),
   (202, 'Rockets'),
   (203, 'Trail'),
   (204, 'Spurs'),
   (205, 'Thunders'),
   (206, 'Jazz'),
   (207, 'Clippers'),
   (208, 'Kings');

INSERT INTO serve
VALUES
   (100,200,1997,2016),
   (101,200,1999,2010),
   (102,200,2001,2005),
   (106,200,2000,2011),
   (107,200,2001,2009),
   (103,201,1999,2018),
   (104,201,2006,2015),
   (107,201,2007,2010),
   (108,201,2010,2016),
   (109,201,2011,2015),
   (105,202,2015,2019),
   (109,202,2017,2019),
   (110,202,2007,2009);

INSERT INTO follow
VALUES
   (100,101,95),
   (100,102,91),
   (100,106,90),
   (101,100,95),
   (101,102,91),
   (102,101,75),
   (103,102,70),
   (104,103,50),
   (104,105,60),
   (105,104,83),
   (105,110,87),
   (106,100,88),
   (106,107,81),
   (107,106,92),
   (107,108,97),
   (108,109,95),
   (109,110,78),
   (110,109,72),
   (110,105,85);

在 Nebula Graph 插入數據

Nebula Graph 中插入數據與上述相似。首先,咱們須要定義好數據結構,也就是建立好 schema。而後能夠選擇手動或使用 Nebula Graph Studio (Nebula Graph 的可視化工具)導入數據。這裏咱們手動添加數據。

在下方的 INSERT 插入語句中,咱們向圖空間 NBA 插入了球員數據(這和在 MySQL 中插入數據相似)。

INSERT VERTEX player(name, age) VALUES
100: ('Tim Duncan', 42),
101: ('Tony Parker', 36),
102: ('LaMarcus Aldridge', 33),
103: ('Rudy Gay', 32),
104: ('Marco Belinelli', 32),
105: ('Danny Green', 31),
106: ('Kyle Anderson', 25),
107: ('Aron Baynes', 32),
108: ('Boris Diaw', 36),
109: ('Tiago Splitter', 34),
110: ('Cory Joseph', 27);

考慮到篇幅限制,此處咱們將跳過插入球隊和邊的重複步驟。你能夠點擊此處下載示例數據親自嘗試。

Nebula-Graph-Studio

增刪改查(CRUD)

本節介紹如何使用 SQL 和 nGQL 語句建立(C)、讀取(R)、更新(U)和刪除(D)數據。

插入數據

mysql> INSERT INTO player VALUES (100, 'Tim Duncan', 42);

nebula> INSERT VERTEX player(name, age) VALUES 100: ('Tim Duncan', 42);

查詢數據

查找 ID 爲 100 的球員並返回其 name 屬性:

mysql> SELECT player.name FROM player WHERE player.id = 100;

nebula> FETCH PROP ON player 100 YIELD player.name;

更新數據

mysql> UPDATE player SET name = 'Tim';

nebula> UPDATE VERTEX 100 SET player.name = "Tim";

刪除數據

mysql> DELETE FROM player WHERE name = 'Tim';

nebula> DELETE VERTEX 121;
nebula> DELETE EDGE follow 100 -> 200;

創建索引

返回年齡超過 36 歲的球員。

SELECT player.name
FROM player
WHERE player.age < 36;

使用 nGQL 查詢有些不一樣,由於您必須在過濾屬性以前建立索引。更多信息請參見 索引文檔

CREATE TAG INDEX player_age ON player(age);
REBUILD TAG INDEX player_age OFFLINE;
LOOKUP ON player WHERE player.age < 36;

示例查詢

本節提供一些示例查詢供您參考。

示例 1

在表 player 中查詢 ID 爲 100 的球員並返回其 name 屬性。

SELECT player.name
FROM player
WHERE player.id = 100;

接下來使用 Nebula Graph 查找 ID 爲 100 的球員並返回其 name 屬性。

FETCH PROP ON player 100 YIELD player.name;

Nebula Graph 使用 FETCH 關鍵字獲取特定點或邊的屬性。本例中,屬性即爲點 100 的名稱。nGQL 中的 YIELD 關鍵字至關於 SQL 中的 SELECT

示例 2

查找球員 Tim Duncan 並返回他效力的全部球隊。

SELECT a.id, a.name, c.name
FROM player a
JOIN serve b ON a.id=b.player_id
JOIN team c ON c.id=b.team_id
WHERE a.name = 'Tim Duncan'

使用以下 nGQL 語句完成相同操做:

CREATE TAG INDEX player_name ON player(name);
REBUILD TAG INDEX player_name OFFLINE;
LOOKUP ON player WHERE player.name == 'Tim Duncan' YIELD player.name AS name | GO FROM $-.VertexID OVER serve YIELD $-.name, $$.team.name;

這裏須要注意一下,在 nGQL 中的等於操做採用的是 C 語言風格的 ==,而不是SQL風格的 =

示例 3

如下查詢略複雜,如今咱們來查詢球員 Tim Duncan 的隊友。

SELECT a.id, a.name, c.name
FROM player a
JOIN serve b ON a.id=b.player_id
JOIN team c ON c.id=b.team_id
WHERE c.name IN (SELECT c.name
FROM player a
JOIN serve b ON a.id=b.player_id
JOIN team c ON c.id=b.team_id
WHERE a.name = 'Tim Duncan')

nGQL 則使用管道將前一個子句的結果做爲下一個子句的輸入。

GO FROM 100 OVER serve YIELD serve._dst AS Team | GO FROM $-.Team OVER serve REVERSELY YIELD $$.player.name;

您可能已經注意到了,咱們僅在 SQL 中使用了 JOIN。這是由於 Nebula Graph 只是使用相似 Shell 的管道對子查詢進行嵌套,這樣更符合咱們的閱讀習慣也更簡潔。

參考資料

咱們建議您親自嘗試上述查詢語句,這將幫您更好地理解 SQL 和 nGQL,並節省您上手 nGQL 的學習時間。如下是一些參考資料:

做者有話說:Hi,Hi ,你們好,我是 Amber,Nebula Graph 的文檔工程師,但願上述內容能夠給你們帶來些許啓發。限於水平,若有不當之處還請斧正,在此感謝^^

喜歡這篇文章?來來來,給咱們的 GitHub 點個 star 表鼓勵啦~~ 🙇‍♂️🙇‍♀️ [手動跪謝]

交流圖數據庫技術?交個朋友,Nebula Graph 官方小助手微信:NebulaGraphbot 拉你進交流羣~~

相關文章
相關標籤/搜索