MySQL數據庫規範及解讀

時間 2019-11-06

標籤 mysql 數據庫規範解讀欄目 MySQL 简体版

原文原文鏈接

1、基礎規範

第一條：必須使用InnoDB存儲引擎

解讀：支持事務、行級鎖、併發性能更好、CPU及內存緩存頁優化使得資源利用率更高sql

第二條：必須使用utf8(utf8mb4)字符集

解讀：萬國碼，無需轉碼，無亂碼風險，節省空間，utf8mb4是utf8的超集，因爲近年移動設備的增多，emoji表情以及部分不常見漢字在utf8下會表現爲亂碼，故須要升級至utf8mb4數據庫

第三條：數據表、數據字段必須加入中文註釋

解讀：N年後誰會知道這個a1,a2,a3字段是幹嗎的緩存

第四條：禁止使用存儲過程、視圖、觸發器、Event

解讀：高併發大數據的互聯網業務，架構設計思路是「解放數據庫CPU，將計算轉移到服務層」，併發量大的狀況下，這些功能極可能將數據庫拖死，業務邏輯放到服務層具有更好的擴展性，可以輕易實現「增機器就加性能」。數據庫擅長存儲與索引，CPU計算仍是上移吧架構

第五條：禁止存儲大文件或者大照片

解讀：爲什麼要讓數據庫作它不擅長的事情？大文件和照片存儲在文件系統，數據庫裏存URI多好併發

2、命名規範

第一條：只容許 使用內網域名，而不是ip鏈接數據庫

解讀：雖然IP訪問更快，域名訪問須要內網dns，可是對於大數據庫的擴展和遷庫考慮，域名更好函數

第二條：線上環境、開發環境、測試環境數據庫內網域名遵循命名規範

業務名稱：xxx
線上環境：dj.xxx.db
開發環境：dj.xxx.rdb
測試環境：dj.xxx.tdb
從庫在名稱後加-s標識，備庫在名稱後加-ss標識
線上從庫：dj.xxx-s.db
線上備庫：dj.xxx-sss.db高併發

第三條：庫名、表名、字段名：小寫，下劃線風格，不超過32個字符，禁止拼音英文混用

解讀：見名知意，方便後續維護性能

第四條：表名t_xxx，非惟一索引名idx_xxx，惟一索引名uniq_xxx

解讀：見名知意，方便後續維護測試

3、表和字段設計規範

第一條：禁止使用外鍵，若是有外鍵完整性約束，須要應用程序控制

解讀：外鍵會致使表與表之間耦合，update與delete操做都會涉及相關聯的表，十分影響sql的性能，甚至會形成死鎖。高併發狀況下容易形成數據庫性能，大數據高併發業務場景數據庫使用以性能優先大數據

第二條：必須把字段定義爲NOT NULL而且提供默認值

解讀：
a) null的列使索引/索引統計/值比較都更加複雜，對MySQL來講更難優化
b) null這種類型MySQL內部須要進行特殊處理，增長數據庫處理記錄的複雜性；同等條件下，表中有較多空字段的時候，數據庫的處理性能會下降不少
c) null值須要更多的存儲空，不管是表仍是索引中每行中的null的列都須要額外的空間來標識
d) 對null的處理時候，只能採用is null或is not null，而不能採用=、in、<、<>、!=、not in這些操做符號。如：where name!='shenjian'，若是存在name爲null值的記錄，查詢結果就不會包含name爲null值的記錄

第三條：禁止使用TEXT、BLOB類型

解讀：會浪費更多的磁盤和內存空間，非必要的大量的大字段查詢會淘汰掉熱數據，致使內存命中率急劇下降，影響數據庫性能

第四條：禁止使用小數存儲國幣

解讀：曾經踩過這樣的坑，100元分3天攤銷，天天攤銷(100/3)元，結果獲得3個33.33。後來實施對帳系統，始終有幾分錢對不齊，鬱悶了好久（不是幾分錢的事，是業務方質疑的眼神讓研發很不爽），最後發現是除法惹的禍
解決方案：使用「分」做爲單位，這樣數據庫裏就是整數了

第五條：必須使用varchar(20)存儲手機號

解讀：
a) 涉及到區號或者國家代號，可能出現+-()
b) 手機號會去作數學運算麼？
c) varchar能夠支持模糊查詢，例如：like「138%」

第六條：禁止使用ENUM，可以使用TINYINT代替

解讀：
a) 增長新的ENUM值要作DDL操做
b) ENUM的內部實際存儲就是整數，你覺得本身定義的是字符串？

第七條：表必須有主鍵，例如自增主鍵

解讀：
a) 主鍵遞增，數據行寫入能夠提升插入性能，能夠避免page分裂，減小表碎片提高空間和內存的使用
b) 主鍵要選擇較短的數據類型， Innodb引擎普通索引都會保存主鍵的值，較短的數據類型能夠有效的減小索引的磁盤空間，提升索引的緩存效率
c) 無主鍵的表刪除，在row模式的主從架構，會致使備庫夯住

4、索引設計規範

第一條：單表索引建議控制在5個之內

解讀：一個好的索引設計，可讓你的效率提升幾十甚至幾百倍，但過多反而拔苗助長

第二條：單索引字段數不容許超過5個

解讀：字段超過5個時，實際已經起不到有效過濾數據的做用了

第三條：禁止在更新十分頻繁、區分度不高的屬性上創建索引

解讀：
a) 更新會變動B+樹，更新頻繁的字段創建索引會大大下降數據庫性能
b) "性別"這種區分度不大的屬性，創建索引是沒有什麼意義的，不能有效過濾數據，性能與全表掃描相似

第四條:創建組合索引，必須把區分度高的字段放在前面

解讀：可以更加有效的過濾數據

5、SQL使用規範

第一條：禁止使用SELECT *，只獲取必要的字段，須要顯示說明列屬性

解讀：
a) 讀取不須要的列會增長CPU、IO、NET消耗
b) 不能有效的利用覆蓋索引
c) 使用SELECT *容易在增長或者刪除字段後出現程序BUG

第二條：禁止使用INSERT INTO t_xxx VALUES(xxx)，必須顯示指定插入的列屬性

解讀：容易在增長或者刪除字段後出現程序BUG

第三條：禁止使用屬性隱式轉換

解讀：SELECT uid FROM t_user WHERE phone=13812345678 會致使全表掃描，而不能命中phone索引，猜猜爲何？
int數據類型優先級高於archer，該查詢會把phone轉換爲int，所以須要把表中全部數據改爲int，因此必須全盤掃描
phone是varchar類型，SQL語句帶入的是整形，故不會命中索引，加個引號就行了：
SELECT uid FROM t_user WHERE phone='13812345678'

第四條：禁止在WHERE條件的屬性上使用函數或者表達式

解讀：SELECT uid FROM t_user WHERE from_unixtime(day)>='2017-02-15' 會致使全表掃描
正確的寫法是：SELECT uid FROM t_user WHERE day>= unix_timestamp('2017-02-15 00:00:00')

第五條：禁止大表使用JOIN查詢，禁止大表使用子查詢

解讀：會產生臨時表，消耗較多內存與CPU，極大影響數據庫性能，大表指的是數據量在1000萬以上的表

第六條：禁止使用OR條件，必須改成IN查詢

解讀：舊版本Mysql的OR查詢是不能命中索引的，即便能命中索引，爲什麼要讓數據庫耗費更多的CPU幫助實施查詢優化呢？

第七條：禁止使用負向查詢，以及%開頭的模糊查詢

解讀：
a) 負向查詢條件：NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等，會致使全表掃描
b) %開頭的模糊查詢，會致使全表掃描
通常來講，WHERE過濾條件不會只帶這麼一個「負向查詢條件」，還會有其餘過濾條件，舉個例子：查詢沈劍已完成訂單以外的訂單（好拗口）：
SELECT oid FROM t_order WHERE uid=123 AND status != 1;
訂單表5000w數據，但uid=123就會迅速的將數據量過濾到不多的級別（uid創建了索引），此時再接上一個負向的查詢條件就無所謂了，掃描的行數自己就會不多
但若是要查詢全部已完成訂單以外的訂單：
SELECT oid FROM t_order WHERE status != 1;
這就掛了，立馬CPU100%，status索引會失效，負向查詢致使全表掃描