全鏈路監控是廣義的概念,不單單指APM(Appliation Perfance Manager&Monitor),包含三大部分:數據庫
Loggong:日誌覆蓋系統日誌,業務日誌,框架日誌. 常規方案ELK elastic, logstash,kibana服務器
Mertic(指標或者度量):覆蓋系統指標,業務指標,中間件指標。框架
Metrics監控主要依賴於時間序列數據庫(TSDB),目前比較成熟的有OpenTSDB,具備分佈式的能力能夠橫向擴展,可是相對較重,適用於大中規模企業。也是一個選擇。近年也出現一些輕量級的TSDB,好比InfluxDB和Prometheus,這些產品函數報表豐富,自帶告警模塊,可是分佈式能力不足。Grafana是Metrics報表展現的社區標配。機器學習
Trancing(追蹤):覆蓋微服務,存儲,中間件。經常使用的APM框架,好比Skywalking,CAT,ZipKin等這些。分佈式
這三者結合起來構成完整的全鏈路監控體系。是梳理業務,排查問題的基石。函數
測試環境部署硬件最低要求(全部組件都是單臺機器便可):微服務
組件學習 |
做用測試 |
CPU代理 |
內存 |
磁盤類型 |
磁盤大小 |
---|---|---|---|---|---|
ElasticSearch集羣1 | 統一存儲日誌 | 4核 | 32GB | SSD最好 | 500GB |
Kibana | 查看日誌的平臺 | 2核 | 4GB | 普通磁盤 | 500GB |
Logstash | 日誌處理中間件 | 4核 | 16GB | 普通磁盤 | 500GB |
ElasticSearch集羣2 | Skywalking Trace數據收集 | 4核 | 32GB | SSD最好 | 500GB |
Skywalking | Skywalking服務端 & 管理臺 | 4核 | 16GB | 普通磁盤 | 500GB |
InfluxDb | 存儲指標的時間序列數據庫 | 4核 | 16GB | SSD最好 | 500GB |
Grafana | 查看指標的平臺 | 2核 | 4GB | 普通磁盤 | 500GB |
監控詳情討論,監控覆蓋的幾個方面。