數據庫規範

@see  http://mp.weixin.qq.com/s/Yjh_fPgrjuhhOZyVtRQ-SAsql

1、基礎規範
(1)必須使用InnoDB存儲引擎
解讀:支持事務、行級鎖、併發性能更好、CPU及內存緩存頁優化使得資源利用率更高

(2)默認使用utf8mb4字符集
解讀:utf8mb4是utf8的超集,emoji表情以及部分不常見漢字在utf8下會表現爲亂碼,故須要升級至utf8mb4。
默認使用這個字符集的緣由是:「標準,萬國碼,無需轉碼,無亂碼風險」,並不「節省空間」。

(3)數據表、數據字段必須加入中文註釋
解讀:N年後誰tm知道這個r1,r2,r3字段是幹嗎的

(4)儘可能不使用存儲過程、視圖、觸發器、Event
解讀:高併發大數據的互聯網業務,架構設計思路是「解放數據庫CPU,將計算轉移到服務層」,併發量大的狀況下,這些功能極可能將數據庫拖死,業務邏輯放到服務層具有更好的擴展性,可以輕易實現「增機器就加性能」。數據庫擅長存儲與索引,CPU計算仍是上移吧

(5)禁止存儲大文件或者大照片
解讀:爲什麼要讓數據庫作它不擅長的事情?大文件和照片存儲在文件系統,數據庫裏存URI多好

2、命名規範
(6)只容許使用內網域名,而不是ip鏈接數據庫

(7)線上環境、開發環境、測試環境數據庫內網域名遵循命名規範
業務名稱:xxx
線上環境:dj.xxx.db
開發環境:dj.xxx.rdb
測試環境:dj.xxx.tdb
從庫在名稱後加-s標識,備庫在名稱後加-ss標識
線上從庫:dj.xxx-s.db
線上備庫:dj.xxx-sss.db

(8)庫名、表名、字段名:小寫,下劃線風格,不超過32個字符,必須見名知意,禁止拼音英文混用

(9)表名t_xxx,非惟一索引名idx_xxx,惟一索引名uniq_xxx

3、表設計規範
(10)單實例表數目必須小於500

(11)單表列數目必須小於30

(12)表必須有主鍵,例如自增主鍵
解讀:
a)主鍵遞增,數據行寫入能夠提升插入性能,能夠避免page分裂,減小表碎片提高空間和內存的使用
b)主鍵要選擇較短的數據類型, Innodb引擎普通索引都會保存主鍵的值,較短的數據類型能夠有效的減小索引的磁盤空間,提升索引的緩存效率
c) 無主鍵的表刪除,在row模式的主從架構,會致使備庫夯住

(13)禁止使用外鍵,若是有外鍵完整性約束,須要應用程序控制
解讀:外鍵會致使表與表之間耦合,update與delete操做都會涉及相關聯的表,十分影響sql 的性能,甚至會形成死鎖。高併發狀況下容易形成數據庫性能,大數據高併發業務場景數據庫使用以性能優先

4、字段設計規範
(14)必須把字段定義爲NOT NULL而且提供默認值
解讀:
a)null的列使索引/索引統計/值比較都更加複雜,對MySQL來講更難優化
b)null 這種類型MySQL內部須要進行特殊處理,增長數據庫處理記錄的複雜性;同等條件下,表中有較多空字段的時候,數據庫的處理性能會下降不少
c)null值須要更多的存儲空,不管是表仍是索引中每行中的null的列都須要額外的空間來標識
d)對null 的處理時候,只能採用is null或is not null,而不能採用=、in、<、<>、!=、not in這些操做符號。如:where name!=’shenjian’,若是存在name爲null值的記錄,查詢結果就不會包含name爲null值的記錄

(15)禁止使用TEXT、BLOB類型
解讀:會浪費更多的磁盤和內存空間,非必要的大量的大字段查詢會淘汰掉熱數據,致使內存命中率急劇下降,影響數據庫性能

(16)禁止使用小數存儲貨幣
解讀:使用整數吧,小數容易致使錢對不上。使用「分」做爲單位,這樣數據庫裏就是整數了。

(17)必須使用varchar(20)存儲手機號
解讀:
a)涉及到區號或者國家代號,可能出現+-()
b)手機號會去作數學運算麼?
c)varchar能夠支持模糊查詢,例如:like「138%」

(18)禁止使用ENUM,可以使用TINYINT代替
解讀:
a)增長新的ENUM值要作DDL操做
b)ENUM的內部實際存儲就是整數,你覺得本身定義的是字符串?

5、索引設計規範
(19)單表索引建議控制在5個之內

(20)單索引字段數不容許超過5個
解讀:字段超過5個時,實際已經起不到有效過濾數據的做用了

(21)禁止在更新十分頻繁、區分度不高的屬性上創建索引
解讀:
a)更新會變動B+樹,更新頻繁的字段創建索引會大大下降數據庫性能
b)「性別」這種區分度不大的屬性,創建索引是沒有什麼意義的,不能有效過濾數據,性能與全表掃描相似

(22)創建組合索引,必須把區分度高的字段放在前面
解讀:可以更加有效的過濾數據

6、SQL使用規範
(23)禁止使用SELECT *,只獲取必要的字段,須要顯示說明列屬性
解讀:
a)讀取不須要的列會增長CPU、IO、NET消耗
b)不能有效的利用覆蓋索引
c)使用SELECT *容易在增長或者刪除字段後出現程序BUG

(24)禁止使用INSERT INTO t_xxx VALUES(xxx),必須顯示指定插入的列屬性
解讀:容易在增長或者刪除字段後出現程序BUG

(25)禁止使用屬性隱式轉換
解讀:SELECT uid FROM t_user WHERE phone=13812345678 會致使全表掃描,而不能命中phone索引,猜猜爲何?(這個線上問題不止出現過一次)

(26)禁止在WHERE條件的屬性上使用函數或者表達式
解讀:SELECT uid FROM t_user WHERE from_unixtime(day)>='2017-02-15' 會致使全表掃描
正確的寫法是:SELECT uid FROM t_user WHERE day>= unix_timestamp('2017-02-15 00:00:00')

(27)禁止負向查詢,以及%開頭的模糊查詢
解讀:
a)負向查詢條件:NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等,會致使全表掃描
b)%開頭的模糊查詢,會致使全表掃描

(28)禁止大表使用JOIN查詢,禁止大表使用子查詢
解讀:會產生臨時表,消耗較多內存與CPU,極大影響數據庫性能

(29)禁止使用OR條件,必須改成IN查詢
解讀:舊版本Mysql的OR查詢是不能命中索引的,即便能命中索引,爲什麼要讓數據庫耗費更多的CPU幫助實施查詢優化呢?

(30)應用程序必須捕獲SQL異常,並有相應處理數據庫

相關文章
相關標籤/搜索