zabbix告警信息網絡
當前狀態:PROBLEM:2020-11-28T00:15:41.833920+08:00 0 [ERROR] [MY-011496] [Repl] Plugin group_replication reported: 'This server is not able to reach a majority of members in the group. This server will now block all updates. The server will remain blocked for the next 5 seconds. Unless contact with the majority is restored, after this time the member will error out and leave the group. It is possible to use group_replication_force_members to force a new group membership.'less
關於MGR集羣有幾點須要注意的地方,不然可能會生產事故的:
一、備份不要在MGR集羣上進行備份,在災備庫上備份
二、大數據抽取數據不要在MGR集羣上,也要在災備庫上抽取ide
關於告警咱們能夠簡單分析一下,三節點MGR集羣,一個節點沒法和多數節點通訊,致使的結果會阻塞全部更新。這個阻塞前會有5秒的保留時間,是根據一個 組複製參數group_replication_member_expel_timeout,默認值5s,固然這個時間要看本身使用的MySQL版本決定。大數據
分析思路:
一、查看時間點的系統資源使用狀況,內存、CPU、網絡流量、磁盤使用率等
二、發現磁盤使用率異常、磁盤IO異常,大量的寫入操做
三、MGR其餘節點無大量寫入,分析多是臨時文件致使
四、查看慢查詢日誌,是否有排序、分組類操做,致使生產大量臨時文件等this
結論:
大數據抽數致使的磁盤IO耗盡,系統無響應,MGR集羣沒法通訊,無響應節點被驅除出集羣,這個鍋DBA不能背啊~rest