數據庫設計的標準

時間 2019-11-11

標籤數據庫設計標準欄目 SQL 简体版

原文原文鏈接

1、基礎規範
（1）必須使用InnoDB存儲引擎
解讀：支持事務、行級鎖、併發性能更好、CPU及內存緩存頁優化使得資源利用率更高

（2）必須使用UTF8字符集
解讀：萬國碼，無需轉碼，無亂碼風險，節省空間

（3）數據表、數據字段必須加入中文註釋
解讀：N年後誰tm知道這個r1,r2,r3字段是幹嗎的

（4）禁止使用存儲過程、視圖、觸發器、Event
解讀：高併發大數據的互聯網業務，架構設計思路是「解放數據庫CPU，將計算轉移到服務層」，併發量大的狀況下，這些功能極可能將數據庫拖死，業務邏輯放到服務層具有更好的擴展性，可以輕易實現「增機器就加性能」。數據庫擅長存儲與索引，CPU計算仍是上移吧

（5）禁止存儲大文件或者大照片
解讀：爲什麼要讓數據庫作它不擅長的事情？大文件和照片存儲在文件系統，數據庫裏存URI多好

2、命名規範
（6）只容許使用內網域名，而不是ip鏈接數據庫

（7）線上環境、開發環境、測試環境數據庫內網域名遵循命名規範
業務名稱：xxx
線上環境：dj.xxx.db
開發環境：dj.xxx.rdb
測試環境：dj.xxx.tdb
從庫在名稱後加-s標識，備庫在名稱後加-ss標識
線上從庫：dj.xxx-s.db
線上備庫：dj.xxx-sss.db

（8）庫名、表名、字段名：小寫，下劃線風格，不超過32個字符，必須見名知意，禁止拼音英文混用

（9）表名t_xxx，非惟一索引名idx_xxx，惟一索引名uniq_xxx

3、表設計規範
（10）單實例表數目必須小於500

（11）單表列數目必須小於30

（12）表必須有主鍵，例如自增主鍵
解讀：
a）主鍵遞增，數據行寫入能夠提升插入性能，能夠避免page分裂，減小表碎片提高空間和內存的使用
b）主鍵要選擇較短的數據類型， Innodb引擎普通索引都會保存主鍵的值，較短的數據類型能夠有效的減小索引的磁盤空間，提升索引的緩存效率
c）無主鍵的表刪除，在row模式的主從架構，會致使備庫夯住

（13）禁止使用外鍵，若是有外鍵完整性約束，須要應用程序控制
解讀：外鍵會致使表與表之間耦合，update與delete操做都會涉及相關聯的表，十分影響sql 的性能，甚至會形成死鎖。高併發狀況下容易形成數據庫性能，大數據高併發業務場景數據庫使用以性能優先

4、字段設計規範
（14）必須把字段定義爲NOT NULL而且提供默認值
解讀：
a）null的列使索引/索引統計/值比較都更加複雜，對MySQL來講更難優化
b）null 這種類型MySQL內部須要進行特殊處理，增長數據庫處理記錄的複雜性；同等條件下，表中有較多空字段的時候，數據庫的處理性能會下降不少
c）null值須要更多的存儲空，不管是表仍是索引中每行中的null的列都須要額外的空間來標識
d）對null 的處理時候，只能採用is null或is not null，而不能採用=、in、<、<>、!=、not in這些操做符號。如：where name!=’shenjian’，若是存在name爲null值的記錄，查詢結果就不會包含name爲null值的記錄

（15）禁止使用TEXT、BLOB類型
解讀：會浪費更多的磁盤和內存空間，非必要的大量的大字段查詢會淘汰掉熱數據，致使內存命中率急劇下降，影響數據庫性能

（16）禁止使用小數存儲貨幣
解讀：使用整數吧，小數容易致使錢對不上

（17）必須使用varchar(20)存儲手機號
解讀：
a）涉及到區號或者國家代號，可能出現+-()
b）手機號會去作數學運算麼？
c）varchar能夠支持模糊查詢，例如：like「138%」

（18）禁止使用ENUM，可以使用TINYINT代替
解讀：
a）增長新的ENUM值要作DDL操做
b）ENUM的內部實際存儲就是整數，你覺得本身定義的是字符串？

5、索引設計規範
（19）單表索引建議控制在5個之內

（20）單索引字段數不容許超過5個
解讀：字段超過5個時，實際已經起不到有效過濾數據的做用了

（21）禁止在更新十分頻繁、區分度不高的屬性上創建索引
解讀：
a）更新會變動B+樹，更新頻繁的字段創建索引會大大下降數據庫性能
b）「性別」這種區分度不大的屬性，創建索引是沒有什麼意義的，不能有效過濾數據，性能與全表掃描相似

（22）創建組合索引，必須把區分度高的字段放在前面
解讀：可以更加有效的過濾數據

6、SQL使用規範
（23）禁止使用SELECT *，只獲取必要的字段，須要顯示說明列屬性
解讀：
a）讀取不須要的列會增長CPU、IO、NET消耗
b）不能有效的利用覆蓋索引
c）使用SELECT *容易在增長或者刪除字段後出現程序BUG

（24）禁止使用INSERT INTO t_xxx VALUES(xxx)，必須顯示指定插入的列屬性
解讀：容易在增長或者刪除字段後出現程序BUG

（25）禁止使用屬性隱式轉換
解讀：SELECT uid FROM t_user WHERE phone=13812345678 會致使全表掃描，而不能命中phone索引，猜猜爲何？（這個線上問題不止出現過一次）

（26）禁止在WHERE條件的屬性上使用函數或者表達式
解讀：SELECT uid FROM t_user WHERE from_unixtime(day)>='2017-02-15' 會致使全表掃描
正確的寫法是：SELECT uid FROM t_user WHERE day>= unix_timestamp('2017-02-15 00:00:00')

（27）禁止負向查詢，以及%開頭的模糊查詢
解讀：
a）負向查詢條件：NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等，會致使全表掃描
b）%開頭的模糊查詢，會致使全表掃描

（28）禁止大表使用JOIN查詢，禁止大表使用子查詢
解讀：會產生臨時表，消耗較多內存與CPU，極大影響數據庫性能

（29）禁止使用OR條件，必須改成IN查詢
解讀：舊版本Mysql的OR查詢是不能命中索引的，即便能命中索引，爲什麼要讓數據庫耗費更多的CPU幫助實施查詢優化呢？

（30）應用程序必須捕獲SQL異常，並有相應處理mysql

總結：大數據量高併發的互聯網業務，極大影響數據庫性能的都不讓用，不讓用喲。sql

(一)核心軍規
(1)不在數據庫作運算
cpu計算務必移至業務層；
(2)控制單表數據量
int型不超過1000w，含char則不超過500w；
合理分表；
限制單庫表數量在300之內；
(3)控制列數量
字段少而精，字段數建議在20之內；
(4)平衡範式與冗餘
效率優先；
每每犧牲範式；
(5)拒絕3B
拒絕大sql語句：big sql
拒絕大事物：big transaction
拒絕大批量：big batch數據庫

(二)字段類軍規
(6)用好數值類型
tinyint(1Byte)
smallint(2Byte)
mediumint(3Byte)
int(4Byte)
bigint(8Byte)
bad case：int(1)/int(11)
(7)字符轉化爲數字
用int而不是char(15)存儲ip
(8)優先使用enum或set
例如：`sex` enum (‘F’, ‘M’)
(9)避免使用NULL字段
NULL字段很難查詢優化；
NULL字段的索引須要額外空間；
NULL字段的複合索引無效；
bad case：
`name` char(32) default null
`age` int not null
good case：
`age` int not null default 0
(10)少用text/blob
varchar的性能會比text高不少；
實在避免不了blob，請拆表；
(11)不在數據庫裏存圖片
這個我不能理解！
但這是趕集網的經驗，求detail！緩存

(三)索引類軍規
(12)謹慎合理使用索引
改善查詢、減慢更新；
索引必定不是越多越好(能不加就不加，要加的必定得加)；
覆蓋記錄條數過多不適合建索引，例如「性別」；
(13)字符字段必須建前綴索引
(14)不在索引作列運算
！！！不僅是索引，都不能作列運算吧！！！
bad case：
select id where age +1 = 10;
(15)innodb主鍵推薦使用自增列；
主鍵創建聚簇索引；
主鍵不該該被修改；
字符串不該該作主鍵；
若是不指定主鍵，innodb會使用惟一且非空值索引代替；
(16)不用外鍵
請由程序保證約束；架構

(四)sql類軍規
(17)sql語句儘量簡單
一條sql只能在一個cpu運算；
大語句拆小語句，減小鎖時間；
一條大sql能夠堵死整個庫；
(18)簡單的事務
事務時間儘量短；
bad case：
上傳圖片事務
(19)避免使用trig/func
觸發器、函數不用；
客戶端程序取而代之；
(20)不用select *
消耗cpu，io，內存，帶寬；
這種程序不具備擴展性；
(21)OR改寫爲IN()
or的效率是n級別；
in的消息時log(n)級別；
in的個數建議控制在200之內；
select id from t where phone=’159′ or phone=’136′;
=>
select id from t where phone in (’159′, ’136′);
(22)OR改寫爲UNION
mysql的索引合併很弱智
select id from t where phone = ’159′ or name = ‘john’;
=>
select id from t where phone=’159′
union
select id from t where name=’jonh’
(23)避免負向%
(24)慎用count(*)
(25)同上
(26)limit高效分頁
limit越大，效率越低
select id from t limit 10000, 10;
=>
select id from t where id > 10000 limit 10;
(27)使用union all替代union
union有去重開銷
(28)少用鏈接join
(29)使用group by
分組；
自動排序；
(30)請使用同類型比較
(31)使用load data導數據
load data比insert快約20倍；
(32)打散批量更新
(33)新能分析工具
show profile;
mysqlsla;
mysqldumpslow;
explain;
show slow log;
show processlist;
show query_response_time(percona);併發