MySQL數據庫操做規範

時間 2020-08-09

原文原文鏈接

MySQL數據庫操做規範

文檔說明:
該文檔旨在對MySQL數據庫的使用作一個統一的約定和規範；以便使你們更明確、更有效的用好數據庫，最終使數據庫發揮更好的做用，從而提高產品的質量。html

1、基礎規範

1.一、【強制】使用InnoDB存儲引擎。
解讀：InnoDB存儲引擎是MySQL默認存儲引擎，支持事務和行級鎖，併發性能更好，CPU及內存緩存頁優化使得資源利用率更高,而且MyISAM在8.0中考慮移除了。前端

1.二、【強制】使用統一的字符集(utf8或utf8mb4)，若是有存儲emoji表情之類的，則須要使用utf8mb4，不然使用utf8便可。
解讀：無需轉碼，無亂碼風險；utf8mb4向下兼容utf8但存儲使用的空間會比utf8略大。mysql

1.三、【強制】表、字段必須加入中文註釋，註釋要言簡意賅。
解讀：便於識別表和字段的用途，有利於維護；
反例:t_company_organization_scope_employee 能夠採用縮寫改爲t_com_org_scope_empsql

1.四、【強制】禁止使用存儲過程、視圖、觸發器、Event。
解讀：高併發大數據的互聯網業務，架構設計思路是「解放數據庫CPU，將計算轉移到服務層」，併發量大的狀況下，這些功能極可能將數據庫拖死，業務邏輯放到服務層具有更好的擴展性，可以輕易實現「增機器就加性能」。數據庫擅長存儲與索引，CPU計算仍是上移到業務層。放到業務層也便於管理和維護。數據庫

1.五、【強制】禁止存儲大文件或者圖片。
解讀：大文件和圖片存儲在文件系統，數據庫裏存URL信息。後端

2、數據庫設計規範

一、命名規範

1.1【強制】庫名、表名、字段名：必須使用小寫字母，下劃線風格，名稱要簡潔明瞭，長度不超過32個字符。
禁止數字開頭，禁止兩個下劃線中間只出現數字，禁止複數名詞和駝峯命名，禁止出現大寫或中文，禁止使用中劃線。
解讀：
正例：getter_admin，task_config，level3_name
反例：GetterAdmin，taskConfig，level_3_name
備註:對於中劃線，當前公司項目的庫名已經使用了，處於更改爲本考慮能夠統一使用中劃線，但表名、字段名仍然禁止使用中劃線。緩存

1.2【建議】對同一業務模塊或關聯功能的表應當使用相同前綴來區分。
解讀：統一的命名規則便於表格的使用和維護。
正例：如acl_xxx，house_xxx,user_xxx；其中前綴一般爲這個表的模塊或依賴主實體對象的名字，一般來說表名爲：業務動做類型，或是業務類型；網絡

1.3【強制】命名中不容許出現MYSQL數據庫中的保留字。如desc、range、match、delayed、date、now等，請參考MySQL官方保留字:
https://dev.mysql.com/doc/refman/5.7/en/keywords.html架構

1.4【建議】索引命名格式爲：索引類型_字段名縮寫。普通索引名idx_xxx，惟一索引名un_xxx。
解讀：
統一風格便於使用和維護。併發

二、表設計規範

2.1【強制】單表中列的數量必須小於30，單庫表的數量要控制在500個之內。
解讀：
一般來講列數越多，物理文件越大，表的效率越差。
庫中表越多，物理文件就越多，空間消耗就越大。

2.2【強制】表中必須明確指定主鍵，無特殊狀況則要使用自增的UNSIGNED BIGINT型主鍵。
解讀：主鍵的遞增可使數據行在物理文件中按順存放，能夠避免page分裂，減小表碎片的產生提高空間和內存的使用，繼而提升寫入、查詢的性能。

2.3【強制】禁止使用外鍵，若是有外鍵完整性約束，須要應用程序控制。
解讀：外鍵會致使表與表之間耦合，UPDATE與DELETE操做都會涉及相關聯的表，十分影響sql的性能，甚至會形成死鎖。

三、字段設計規範

3.1【強制】表的各個字段必需要設置NOT NULL約束，特別是做爲過濾條件的列！
解讀：
1)全部NULL值在索引中對於一個KEY，在MySQL5.6.17及以後，IS NULL等同於等值查詢，能夠用索引；
2)NULL字段在物理文件上是經過打標籤的方式記錄的，對於這種類型MySQL內部須要進行特殊處理，增長數據庫處理記錄的複雜性;同等條件下，表中有較多個NULL值字段的時候，數據庫的處理性能會下降不少；
3)NULL字段的查詢語句優化空間不大，對NULL的處理只能採用IS NULL或IS NOT NULL，並且沒法使用索引；

3.2【建議】根據實際須要來爲字段設置默認值。
解讀：
默認值能夠經過自動補充列值的方式，在列值不全的狀況下可成功向表中寫入數據；防止了人爲疏忽而致使程序失敗的可能。但這也偏偏是埋下了雷，使得在程序異常時很難發現問題。
爲了程序更加健壯，推薦在設置了NOT NULL的前提下不提供默認值，直接報錯後進行處理。

若是須要設置默認值約束請使用如下默認值:
TINYINT/SMALLINT/INT/BIGINT 整數類型默認值：0
CHAR/VARCHAR 字符類型默認值：'' (空字符串)
DATE 類型默認值：'0000-00-00'
TIME 類型默認值：'00:00:00'
DATETIME 類型默認值：'0000-00-00 00:00:00'

注意：
有一種誤區：只要指定了默認值就OK了,NOT NULL就是多餘的；在插入時對相應列賦值爲NULL時插入表裏會自動填充默認值的。
這個認識是錯誤的，若是沒有NOT NULL，即便有默認值在插入NULL時也不會填充默認值(自增主鍵除外)。
例如:

CREATE TABLE t1(
id      UNSIGNED BIGINT NOT NULL AUTO_INCREMENT ,
name VARCHAR(10) DEFAULT 'xxx' COMMENT '姓名',
age    UNSIGNED SMALLINT DEFAULT 0 COMMENT '年齡',
PRIMARY KEY(id)
)ENGINE=INNODB COMMENT='用戶信息' ;
mysql> INSERT INTO aa (id,NAME,age) VALUES(NULL,NULL,1);

結果:

mysql> select * from t1;
+----+------+------+
| id | name | age  |
+----+------+------+
|  1 | NULL |    1 |
+----+------+------+
1 rows in set (0.00 sec)

看到了吧，name雖然有默認值'xxx'可是在指定NULL後，並無用默認值填充！！

3.3【強制】使用UNSIGNED存儲非負整數。
解讀：
能夠擴大數值的使用範圍，減小範圍查找時MySQL無心義的負值查找、比對的資源浪費。

3.4【強制】小數類型用DECIMAL或者對數值擴大後使用int/bigint 類型來存儲，禁止使用FLOAT和DOUBLE。
解讀：
FLOAT和DOUBLE在存儲、計算的時候，存在精度損失的問題，極可能在值的比較時，獲得不正確結果。若是存儲的數據範圍超過DECIMAL的範圍，建議將數據拆成整數和小數分開存儲。
對於數值精度要求高的場景，特別是在存儲貨幣的場景中一般是經過將‘元’換成‘分’後進行整數存儲，在讀取或寫入的時候，進行轉換。

3.5【強制】枚舉類型禁止使用ENUM，可以使用TINYINT代替。
解讀：
a)增長新的ENUM值要作DDL操做；
b)ENUM的內部實際存儲就是整數；

3.6【強制】若是存儲的字符串長度幾乎相等，請使用定長字符串CHAR類型。
解讀：
在物理文件中定長的字符串是使用統一大小的空間存放的，這在查詢時MySQL可使用統一的偏移量來獲取數據，提高的性能。

3.7【建議】VARCHAR是可變長字符串，必定要根據實際狀況按需設置長度;長度最好不要超過250個漢字字符(utf8編碼)。
解讀：
當VARCHAR存放的字符過多時，在物理文件中存放時會產生行溢出現象；這會影響性能。
選擇合適的字符存儲長度，不但節約數據庫表空間、節約索引存儲，更重要的是提高檢索速度。

3.8【建議】使用VARCHAR存儲電話號碼。
解讀：
a)涉及到區號或者國家代號，可能出現+-()；
b)電話號碼不會作數學運算；
c)VARCHAR能夠支持模糊查詢，例如：LIKE '138%'；

3.9【建議】網絡IP字段，除特殊狀況外一概用INT UNSIGNED來記錄(IP可經過INET_ATON函數轉換爲數值)。
解讀：
將IP地址轉換爲數值來存取，有利於性能提高。

3.10【強制】禁止使用TEXT、BLOB類型，如要使用能夠其將內容垂直拆分到子表中。
解讀：
TEXT、BLOB這些大類型在物理存儲時會使用行溢出的方式來存儲，這會浪費更多的磁盤和內存空間。在從物理文件中讀取這類對象時會額外消耗資源，並且大量的大字段在查詢時會將內存中的大量熱數據淘汰掉，致使內存命中率急劇下降，影響數據庫性能。
若是必定要使用這類對象，能夠將這些字段拆分出去，單獨存放；這樣保證了主表的瘦小。

3.11【建議】字段容許適當冗餘，以提升性能，可是必須考慮冗餘數據的同步狀況。
解讀：
字段的冗餘能夠減小表之間的關聯，使用得當能夠提高性能。
冗餘字段應遵循：不是頻繁修改的字段，不是VARCHAR超長字段，更不能是TEXT字段。

3.12【強制】禁止在數據庫中存儲明文密碼，把密碼加密後存儲。

四、索引設計規範

說明:區分度是指列中存放的數據值中惟一值個數佔中總值個數的比例。

4.1【建議】禁止在更新十分頻繁、區分度不高的屬性上創建索引。
解讀：
a)更新會變動B+樹，更新頻繁的字段創建索引會大大下降數據庫性能；
b)"性別"這種區分度不大的屬性，創建索引是沒有什麼意義的，不能有效過濾數據，性能與全表掃描相似；除非數據存在嚴重傾斜，而且恰好只查詢那部分小範圍數據時才考慮創建。

4.2【建議】業務上具備惟一特性的字段(即便是組合字段的惟一)，必須創建惟一索引。
解讀：不要覺得惟一索引影響了INSERT速度，這個速度損耗能夠忽略，但提升查找速度是明顯的;另外，即便在應用層作了很是完善的校驗和控制，也要作惟一索引。

4.3【建議】在VARCHAR字段上創建索引時，必須指定索引長度，不必對全字段創建索引，根據實際文本區分度決定索引長度。
解讀：索引的長度與區分度是一對矛盾體，通常對字符串類型數據，長度爲20的索引，區分度會高達90%以上，可使用COUNT(DISTINCT LEFT(列名, 索引長度))/COUNT(主鍵)的區分度來肯定。

4.4【建議】索引數量應不超過列總數的40%(通常單表索引建議控制在5個之內)。
解讀：索引過多會增長存儲開銷和增刪改的開銷。

4.5【建議】儘可能使用組合索引，創建組合索引時必須把區分度高的、使用頻率高的字段放在前面，索引中字段數不容許超過3個。
解讀：可以更加有效的過濾數據，索引上字段超過3個時，實際的過濾數據效果已經很差了，並且還佔用了空間。

4.6【強制】在排序、分組、取惟一的字段上建立索引，常常與其餘表進行關聯的表，在關聯字段上應該創建索引，常常出如今WHERE子句中的字段，特別是大表的字段，應該創建索引。

3、SQL使用規範

一、SQL書寫規則

1.1【建議】SQL語句的大小寫風格要統一。
SQL語句中出現的全部表名、表別名、字段名等自定義數據庫對象都應小寫。
SQL語句中出現的系統保留字、內置函數名、SQL保留字等都應大寫，不建議使用保留字。
解讀：
大小寫區分開，便於對象的識別；
如:
SELECT c1,c2 FROM tab WHERE c1='xxx';
INSERT INTO tab(c1,c2,c3) VALUES ('a','b',30);

1.2【強制】禁止使用MySQL特有的非標準SQL語法，全部SQL都必須使用標準寫法。
解讀:
MySQL支持多種非標準SQL語法，這會使得SQL書寫變得混亂，難以維護；因此必定要按標準SQL來書寫。

MySQL支持的非標準INSERT語法:
1)INSERT INTO employees SET employee_name='John',date='2018-06-15',mployee_age=30;
2)INSERT INTO employees(employee_name,date,mployee_age)
VALUES ('John','2018-06-15'，30）
ON DUPLICATE KEY UPDATE ;

標準寫法:
INSERT INTO employees(employee_name,date,mployee_age)
VALUES ('John','2018-06-15'，30);

1.3【建議】SQL語句中表的別名應簡短明瞭，宜反映表名的實際意義。
解讀：表名比較長的時候必定要使用別名來優化SQL書寫方式；這樣的好處有:
1)方便表對象的引用；
2)更有利於SQL的閱讀、管理；
3)減少慢SQL被截斷的可能(慢SQL以表方式存放的狀況)；
4)最重要的還能夠節省數據庫內存。

1.4【建議】同一項目的SQL書寫格式應該統一。

二、可讀性規則

2.1【強制】不容許使用SELECT ，必須指定列名；須要什麼就索取什麼。
解讀：
a)對的解析以及讀取那些不須要的列會增長CPU、IO、NET消耗；
b)不能有效的利用覆蓋索引；
c)使用SELECT *容易在增長或者刪除字段後出現程序BUG；

2.2【強制】INSERT必須明確指定插入的字段名。
解讀：
避免在增長或者刪除字段後出現程序BUG。
正例：INSERT INTO tab(c1,c2,c3) VALUES ('a','b',30);

2.3【強制】不等於統一使用"<>"。
SQL認爲"<>"和"!="是等價的，都表明不等於的意義。爲了統一，不等於一概使用"!="表示。

2.4【強制】在錶鏈接時要對錶設置別名，別名要簡潔明瞭，控制在5個英文字符內，不易過長。

2.5【強制】應避免寫複雜的SQL語句。
解讀：
a) 增長SQL可讀性；
b) 複雜SQL每每效率不是很好。

2.6【強制】建議不用now(),uuid()等函數來填充SQL。
解讀：
在MySQL使用函數來計算結果值，會消耗MySQL的CPU資源。
如：INSERT INTO tab(a,b,c) VALUES('aa','bb',NOW()); 建議：c的值直接從前端傳入。

三、性能相關規則

3.1【強制】避免在數據庫中進⾏數學運算(MySQL不擅長數學運算和邏輯判斷)

3.2【強制】SQL語句應避免對大表的全表掃描操做，對大表的操做應儘可能使用索引。

3.3【強制】SQL語句應避免’硬’刪除的操做,應該採用修改狀態的’軟’刪除。
解讀：
頻繁的物理刪除會使表的碎片增多，影響性能。

3.4【強制】應按照業務須要使用事務，同時應保持事務簡短，避免大事務，確保整個事務涉及的數據庫對象不要超過5個，執行時間不要超過3秒。

3.5【強制】每一個SQL返回結果的行數不能太多，用多少取多少，要控制在500行之內。統計分析除外。

3.6【強制】在事務完整性的基礎上，SQL語句應在程序中顯式使用 COMMIT，ROLLBACK，儘快提交事務，釋放系統資源。

3.7【強制】對大量數據的更新要打散後批量更新，不要一次更新太多數據。(大事務)

3.8【強制】對大量數據插入時不要使用逐條的INSERT語句進行插入，要使用合併插入的方式。
解讀：由於MySQL默認開啓了自動提交，若是一條條執行就意味着每條結束後都有執行一次COMMIT，這樣嚴重影響性能。合併插入則是一次COMMIT。
低效：
INSERT INTO emp (empno,ename,deptno) VALUES(1,'a',10);
INSERT INTO emp (empno,ename,deptno) VALUES(2,'b',20);
INSERT INTO emp (empno,ename,deptno) VALUES(3,'c',30);
INSERT INTO emp (empno,ename,deptno) VALUES(4,'d',10);
INSERT INTO emp (empno,ename,deptno) VALUES(5,'e',10);
INSERT INTO emp (empno,ename,deptno) VALUES(6,'f',10);

高效:
INSERT INTO emp (empno,ename,deptno)
Values (1,'a',10)，(2,'b',20)，(3,'c',30), (4,'d',10), (5,'e',10),(6,'f',10);

3.9【強制】禁止使用屬性的隱式轉換。
解讀：
隱式轉換會致使索引失效，
例如:
t_user的phone是VARCHAR類型，且有索引；
SELECT uid FROM t_user WHERE phone=13812345678; 會致使全表掃描，而不能命中phone索引，由於發生了數值到字符串的隱式轉換。

3.10【強制】去掉where 1=1 這樣無心義或恆真的條件，若是遇到update/delete或遭到sql注入就恐怖了。

3.11【建議】減小子查詢的使用。
解讀：子查詢除了可讀性差以外，一般會在必定程度上影響了SQL運行效率. 應儘可能減小子查詢的使用，採用關聯或其餘效率更高、可讀性更好的方式實現。

3.12【建議】禁止在WHERE條件的列上使用函數或者表達式，要將其改寫到等號右邊。
解讀：
在過濾條件的列上使用函數，會致使列上的索引沒法被使用；
錯誤：SELECT uid FROM t_user WHERE DATE(day)='2017-02-15'; ==>會致使全表掃描
正確：SELECT uid FROM t_user WHERE day>='2017-02-15 00:00:00' and day<='2017-02-15 23:59:59'

3.13【建議】禁止負向查詢，以及%或_開頭的模糊查詢。
解讀：反向操做是不會用到索引的。

a)負向查詢條件：NOT、<>、<>、!<、!>、NOT IN、NOT LIKE等，會致使全表掃描；
b)%或_開頭的模糊查詢，會致使全表掃描；

3.14【建議】SQL語句應避免沒必要要的分組和排序。
解讀：分組和排序操做會用到臨時表，影響性能。

3.15【建議】SQL語句儘量避免多表聯合的複雜查詢。

3.16【建議】禁止對大表進行關聯查詢，禁止大表使用子查詢
解讀：關聯會產生臨時表，並且大表的數據量大，會進一步消耗更多內存與CPU，極大影響數據庫性能。

3.17【建議】禁止使用OR條件，若是是同一列的不一樣值的OR語句能夠改成IN查詢。
解讀：MySQL在執行時內部會對這類OR語句改寫爲IN語句，若是咱們人爲的將最終SQL改寫成IN，那MySQL就不須要消耗資源去作轉換了。
如：
錯誤：SELECT c1,c2 FROM tab WHERE c3 =1 OR c3 = 2;
正確：SELECT c1,c2 FROM tab WHERE c3 IN (1,2);

3.18【建議】禁止使用OR條件，若是是不一樣列的OR語句能夠考慮用UNION替換OR。
解讀：
將OR運算的邏輯判斷使用分條件查詢來實現，能夠很好的提升查詢效率。

低效：
SELECT loc_id , loc_desc , region
FROM location
WHERE loc_id = 10 OR region = 'MELBOURNE';

高效:
SELECT loc_id , loc_desc , region
FROM location
WHERE loc_id = 10
UNION
SELECT loc_id , loc_desc , region
FROM location
WHERE region = 'MELBOURNE';

3.19【建議】IN裏包含的值的個數建議控制在100之內，過多IN的效率不高。

3.20【建議】在使用union時優先考慮使用union all，少使用union。
解讀：
union all不去重，少了排序操做，速度相對比union要快，若是沒有去重的需求，優先使用union all。

3.21【建議】用>=替代>，用<=代替<，幫助MySQL肯定下限和上限。
解讀：
若是不使用’=’指定上下限，MySQL須要本身去分析查找這個邊界值，浪費了資源。