大型互聯網的系統通常會架構散佈於多個數據中心和一些私有/公有云,由真實物理機以及虛擬機組成。架構中部署的關鍵工具包括實現報警的Zabbix,以及一個採集、聚合和存儲度量的六階段流水線。流水線主要由開源工具構建,其中使用了OpenTSDB、Kafka、Elasticsearch和Grafana,還有一些企業自研的工具。html
監控的一些關鍵度量,包括CPU平均負載、內存、線程、網絡鏈接、磁盤空間和性能等。對於電子商務網站而言,網絡監控相當重要。網絡監控實現爲多個層級,包括使用ping監控跨數據中心的連通性,使用Observium監控網絡設備帶寬,使用Uptime Robot監控外部可訪問性和系統運行時間及負載狀況(uptime)。監控的實現原理一般分爲兩大類,即拉取模式(Pull)和推送模式(Push)。在拉取模式下,存在一個集中式系統,輪詢各個被監控系統並從中拉取數據。Nagios等多種傳統的監控系統主要遵循該模式,可是其中部分系統也提供推送模塊。在推送模式下,每一個被監控系統中須要運行一個代理程序。該代理程序採集監控數據,並將數據推送到一箇中央系統。Prometheus等工具使用了推送模式,它們提供推送功能選項。團隊選擇使用推送模式,並在每臺服務器上運行了Zabbix代理。Grafana作爲可視化工具。ios
監控流水線分六個階段,實現從日誌中抽取度量並推送到時序數據庫OpenTSDB。數據庫
第一個階段負責收集日誌。流水線經過運行在每一個服務器上的syslog-ng代理,以UDP方式聚集到一箇中央Logstash服務器。syslog-ng可在類UNIX系統上實現syslog協議。
第二階段進而使用grok分析器分析收集的日誌,並推送到兩個不一樣的Elasticsearch(ELS)集羣。天天分析的日誌總量可達700GB。
第三階段使用稱爲「Data Monster」的企業自研工具(Django-Python),週期性輪詢Elasticsearch集羣,從中抽取度量。
第四階段使用調度系統計算各個度量。該調度系統基於Celery Beat、RabbitMQ和MySQL實現,使用Data Monster從ELS拉取數據,並推送到Kafka集羣。
第五階段生成實際寫入到OpenTSDB的PUT
語句。Apache Kafka一般用於構建持久化流數據隊列。在流水線中,Kafka消費者處理消息,並推送到OpenTSDB中持久存儲。
第六階段使用Grafana查詢數據庫中的消息,生成可視化的儀表盤展現。服務器
架構使用了Zabbix生成報警。此外爲保證高可靠性,OpenTSDB是安裝在多個節點上的。微信
在雲環境中,機器的生命週期是短暫的,這對於須要掌握被監控機器的監視工具而言是一個挑戰。經過使用Zabbix的自動註冊功能解決了這一問題。Zabbix支持使用模板註冊一個新機器。團隊使用了一種基本的Linux模板,用於CPU使用率、平均負載、Java線程等通用系統度量。還使用了一種特定於應用的模板,用於健康檢查和應用性能管理。網絡
關鍵關注點還包括,如何肯定實時監控下的度量粒度問題,以及如何對HTTP響應代碼和請求趨勢等度量進行近距離觀察。前者可支持團隊快速地響應並定位問題,後者可做爲一種早期預警系統,對客戶或服務器端錯誤和應用性能突發問題作出預警。對請求數量變化趨勢的深刻研究,也有助於團隊進一步規劃容量。 架構
------------------------------------------------------------------
運維
今天先到這兒,但願對您在系統架構設計與評估,團隊管理, 項目管理, 產品管理,團隊建設 有參考做用 , 您可能感興趣的文章:
IT運維監控解決方案介紹
微服務監控案例之一
國際化環境下系統架構演化
微服務架構設計
視頻直播平臺的系統架構演化
微服務與Docker介紹
Docker與CI持續集成/CD
互聯網電商購物車架構演變案例
互聯網業務場景下消息隊列架構
互聯網高效研發團隊管理演進之一
消息系統架構設計演進
互聯網電商搜索架構演化之一
企業信息化與軟件工程的迷思
企業項目化管理介紹
軟件項目成功之要素
人際溝通風格介紹一
精益IT組織與分享式領導
學習型組織與企業
企業創新文化與等級觀念
組織目標與我的目標
初創公司人才招聘與管理
人才公司環境與企業文化
企業文化、團隊文化與知識共享
高效能的團隊建設
項目管理溝通計劃
構建高效的研發與自動化運維
某大型電商雲平臺實踐
互聯網數據庫架構設計思路
IT基礎架構規劃方案一(網絡系統規劃)
餐飲行業解決方案之客戶分析流程
餐飲行業解決方案之採購戰略制定與實施流程
餐飲行業解決方案之業務設計流程
供應鏈需求調研CheckList
企業應用之性能實時度量系統演變 微服務
若有想了解更多軟件設計與架構, 系統IT,企業信息化, 團隊管理 資訊,請關注個人微信訂閱號:工具
做者:Petter Liu
出處:http://www.cnblogs.com/wintersun/
本文版權歸做者和博客園共有,歡迎轉載,但未經做者贊成必須保留此段聲明,且在文章頁面明顯位置給出原文鏈接,不然保留追究法律責任的權利。
該文章也同時發佈在個人獨立博客中-Petter Liu Blog。