數據庫分庫解決方案

時間 2020-01-02

標籤數據庫分庫解決方案欄目 SQL 简体版

原文原文鏈接

當業務數據量很是大，單數據庫沒法支撐的時候，有多是單庫已經寫滿了，也可能數據庫讀寫比較頻繁，已經觸碰到單庫的io瓶頸了，這時就須要考慮分庫。數據庫

下面聊一下該怎麼分庫，如何優化：數據庫設計

剛開始只有數據庫A, 後來又加了數據庫B。優化

假如數據表都是有時間戳字段，並且數據查詢條件都帶一個時間戳字段，這樣咱們能夠根據數據建立的時間範圍來分庫，好比給數據庫按年份命名db_2019，到2020年新生成一個庫db_2020，在業務端進行數據讀寫操做時，先根據時間戳條件獲取到年份，而後選擇相應年份的數據庫進行操做。設計

但上面這種方式只適合這種特定的業務場景，並且這種方式，可能舊數據不多讀取，新數據會比較頻繁讀取，會致使不一樣數據庫負載是不均勻的。因此會不會有更好的分片方式呢？答案是確定的。幾乎任何一張表都會有鍵字段，假如鍵值是數字類型，能夠鍵值與數據庫數量取模的方式進行分片，好比鍵值是100，數據庫數量是2，那麼100%2獲得0，就應該存儲到索引爲0的數據庫。假如鍵值是字符串呢，能夠經過crc32(value)算出一個數字，而後再經過數字取模的方式獲得相應的數據庫。索引

假如在使用過程當中，數據庫又不夠用了，須要再擴容，怎麼辦？字符串

停服，根據新的分片邏輯進行數據遷移，起服上線新的分片邏輯。沒毛病，假如業務容許停機一段時間，這也是一種穩妥方式。假如業務不容許停機，或只容許停機很短的時間，這時該如何數據庫擴容呢，或者說該如何平滑地進行數據庫遷移而不影響業務呢？同步

能夠經過下面步驟來io

方案一：分頁