MoSonic：對SubSonic的分佈式存儲、緩存改進嘗試(3)

時間 2020-04-07

標籤 mosonic subsonic 分佈式存儲緩存改進嘗試欄目系統架構简体版

原文原文鏈接

接上文。html

Cache Money雖然解決了數據的讀取性能瓶頸；但開發大網站數據庫面臨的問題遠不至讀壓力。mysql

首先是容量。算法

上千萬/億的數據量並不罕見，單一物理數據庫服務器即使單純承擔寫壓力也會是瓶頸。更況且Cache Money僅僅是在理想情況下才能夠作到數據庫0讀。緩存服務器更新，新增查詢，複雜查詢等等都還會形成讀壓力。sql

比較常見的作法是採用分表，也就是所謂的Sharding，把數據按照必定的規則，分別存儲至多臺數據庫服務器上去。數據庫

其次是變更。緩存

業務需求是不可預測的；不管一開始數據庫表結構定義得如何完備，總會有新需求出來，須要對錶結構作調整才能夠實現。服務器

數據量過了百萬以後，每次對生產服務器作alter table/create index等調整都是痛苦的經歷。數據結構

針對容量與變更這兩個問題，FriendFeed提出的schema-less database design給出了一個至關漂亮的解決方案。app

強烈推薦閱讀FriendFeed的原文。less

FriendFeed的方案大體是這樣：

只有一種表結構，只有兩個列：id + blob/binary(max)
id自己是UUID，這自己能夠很容易作sharding
blob能夠反序列化爲任意結構
查詢經過另外建表實現，比方說users表的blob列反序列化出來的結構中包含一個age的int屬性；要查詢select * from users where age = 18; 那麼就另外建表如user_age，僅包括兩列id / age；先查詢此表得到id，再查詢本來的users表得到完整數據
索引表能夠異步創建，並且，創建的時候它都是跟查詢相關，能夠根據查詢條件作sharding；如上面所的age。

FriendFeed的方案至關聰明，數據自己結構及其簡單，sharding很容易作。寫/讀壓力一會兒就分佈出去。

blob列用於序列化（數據甚至是先zip過再存，CPU強勁，磁盤IO是瓶頸），因此結構能夠隨時變化；只須要保證序列化算法能夠兼容不一樣版本便可。

而靈活的序列化，偏偏是Facebook Thrift所解決的！

（還記得一開始使用Memcached作object cache時採用了Thrift作序列化麼？）

先不考慮Sharding分佈方案，在MoSonic中將各個類定義爲相似下面的結構：