副本集是一組服務器,其中有一個是主服務器(primary),用於處理客戶端請求;還有多個備份服務器(secondary),用於保存主服務器的數據副本。若是主服務器崩潰了,備份服務器會自動將其中一個成員升級爲新的主服務器。mysql
副本集特徵:
· N 個節點的集羣
· 任何節點可做爲主節點
· 全部寫入操做都在主節點上
· 自動故障轉移
· 自動恢復
副本集還有如下幾個須要注意的地方:
1. 最小構成是:primary,secondary,arbiter,通常部署是:primary,2 secondary。
2. 成員數應該爲奇數,若是爲偶數的狀況下添加arbiter,arbiter不保存數據,只投票。
3. 最大50 members,可是隻能有 7 voting members,其餘是non-voting members。redis
一、數據同步
Mongo的複製功能是經過oplog實現的,oplog包含了主節點的每一次寫操做,是主節點的local數據庫中的一個固定集合,備份節點經過查詢這個集合就能夠知道須要進行復制的操做。每一個備份節點有本身的oplog,這樣每一個成員就能夠看成同步源提供給其餘成員使用。備份節點從當前同步源中獲取須要執行的操做,而後在本身的數據集上執行這些操做,最後將這些操做寫入本身的oplog。sql
若是備份節點掛了,當它重啓後,會自動從oplog中最後一個操做開始同步,因爲複製操做的過程是先複製數據再寫入oplog,因此備份節點有可能在已經同步過的數據上再次執行復制操做。Mongo是這麼處理的:將oplog中的同一操做執行屢次與只執行一次的效果是同樣。mongodb
因爲oplog大小是固定的,一般它的使用空間的增加速度與系統處理寫請求的速率近乎相同。可是有些例外狀況:若是單次處理可以影響到多個文檔,那麼每一個受影響的文檔都會對應oplog的一條日誌。好比執行db.coll.remove()刪除了1000000個文檔,那麼oplog中就會有1000000條操做日誌,這樣oplog很快就會被填滿。
數據庫
二、仲裁節點
仲裁者惟一的做用就是選舉,不保存數據,也不會爲客戶端提供服務,它只是爲了知足「大部分」的要求安全
添加仲裁者的兩種方式服務器
>rs.addArb(「server-5:27017」)性能
>rs.add({「_id」:4,」host」:」 server-5:27017」,」arbiterOnly」:true})spa
仲裁的缺點操作系統
好比有三個成員的副本集,其中一個是仲裁節點。當一個數據節點掛了,那麼另外一個數據節點成爲主節點,爲了保證數據安全,就須要添加一個新的備份節點,但因爲仲裁節點無數據,那麼新節點的數據傳輸只能靠當前的主節點完成。那麼它不只要處理應用程序請求,還要數據複製到備份節點,會形成服務器壓力巨大
因此儘可能配置成奇數個數據成員,而不使用仲裁者
三、優先級
優先級表示一個成員渴望成爲主節點的程度,取值範圍0-100,默認1,0表明永遠不能成爲主節點(passive member)
優先級別高的會優先選舉爲主節點(只要他能獲得大部分的支持,而且數據是最新的)
四、心跳
每一個成員每隔兩秒都會向其餘成員發送一個心跳請求,用於檢查每一個成員的狀態,知道本身是否符合大多數的條件。
五、回滾
若是主節點執行了一次寫請求後掛了,可是備份節點還沒來得及複製此次操做,那麼新選舉出來的主節點就會漏掉此次寫操做。這時就會執行回滾過程。
六、內存管理mmap
MongoDB應該分配的內存大小最好知足內存大小>索引+熱數據+鏈接佔用內存,經過db.stats()命令可查看到當前數據庫的索引大小狀況
db.stats()
下面是公司的MongoDB存儲了14億數據,佔1.4T存儲空間
shard1:SECONDARY> db.stats() { "db" : "database", // 當前使用的數據庫 "collections" : 662, // 多少張表 "objects" : 1405948982, // 全部表的多少條數據 -- 14.05億 "avgObjSize" : 1134.649427176014, // 平均每條數據大小 "dataSize" : 1595259207065, // 總數據大小 -- 1.485TB "storageSize" : 768647647232, // 全部數據佔磁盤的大小 -- 715.85G "numExtents" : 0, "indexes" : 1098, // 索引數量 "indexSize" : 173431967744, // 索引大小 -- 160G "ok" : 1 }