MySQL分庫分表

時間 2019-11-11

標籤 mysql 分庫分表欄目 MySQL 简体版

原文原文鏈接

MySQL分庫分表

什麼是分庫分表

分庫分表指的是將原有的單機單庫的單表橫向拆分到多機、多庫的多表前端

爲何要分庫分表

通常狀況下，分庫分表主要是爲了防止:java

單表數據量太大，行數過多，影響讀寫速度
單表數據量太大，磁盤佔用過多，難以存儲、備份、還原

何時須要分庫分表

過早優化是萬惡之源。分庫分表成本極高，不到萬不得已，最好不要分庫分表。mysql

分庫分表以前，咱們能夠先試試如下幾個選項。若是實在必要，再進行分庫分表。git

分庫分表前的幾個選項

1. 什麼都不作

不少時候，分庫分表都是世上無事，庸人自擾。github

一千萬數據量的表，對咱們來講多是個大表，對MySQL來講，可能毫無壓力。MySQL自己對錶容量沒有作限制，有的用戶甚至用MySQL跑着50億行以上的大表。sql

通常狀況下，MySQL使用InnoDB存儲引擎，InnoDB默認的索引頁大小是16KB。InnoDB的索引使用的數據結構是B+Tree，一個索引節點存儲一個索引值加一個子節點地址。以INT類型的索引爲例，一個索引節點佔用4+4=8個字節，一個索引頁能夠存放節點數16KB/8B=2K=2048，構成了一棵2048叉樹。數據庫

若是在磁盤上查找索引，1000萬的數據量須要尋址log(10**7, 2048)=2.11次，也就是2次IO。100億的數據量須要尋址log(10**10, 2048)=3.02次，也就是3次IO。緩存

100億的數據量大約須要磁盤空間10**10*100B=1TB，索引佔用大約10**10*8B=80GB。服務器

因此，只要磁盤、內存和膽子都夠大，用MySQL存儲100億的數據徹底沒問題，也徹底能夠作到毫秒級的讀寫。數據結構

2. 優化業務

在對數據庫動手動腳前，先看看業務系統裏是否是有沒必要要的或者能夠整合的讀寫，是否是儲存了太多毫無價值的數據

3. 數據庫前端加緩存

適當添加緩存，能夠極大地減小數據庫的讀取操做

4. 數據庫加索引

OLTP操做盡可能避免全表掃面

5. 數據庫垂直切分

按業務分庫，按冷熱拆表

6. 表分區

將一個表在物理層拆分爲多個表，對業務層徹底透明。不一樣的表分區能夠指定不一樣的物理磁盤，加大單表容量，提升併發讀寫速度，方便進行大表的備份與還原。

7. 換存儲引擎

MySQL默認的存儲引擎是InnoDB，在不開啓壓縮的狀況下，空間浪費嚴重，通常1000萬行無索引的表佔用空間可達1GB。開啓壓縮後，大概能夠節省一半的空間。換用ARCHIVE歸檔引擎，能夠大幅提升壓縮率，可是不支持索引，沒法進行OLTP查表。換用TokuDB引擎進行折中，能夠在支持索引的狀況下，大幅壓縮磁盤空間佔用，大約能夠節省80%左右的存儲空間。