雲應用監控指南

圖片描述

原文: https://victorops.com/blog/cl...
翻譯: 祝坤榮

DevOps和It團隊已習慣於常年對內部服務器,網絡和應用進行監控和報警處理。而一樣的,因爲基於雲服務的使用率的增加,如今理解團隊怎樣對於雲基礎設施和應用的監控也變得一樣重要。事實上,據估計2020年83%的企業計算會在雲上。html

在DevOps世界裏,是沒有一個監控你雲應用或服務的單一解決方案的。可是,仍是有不少能夠用的技術和工具。因此,若是你對於監控雲服務的時間是個新手,或者你就是想學點東西 - 咱們寫了這個雲應用監控指南來幫你。web

不一樣類型的雲服務

與內部監控方案同樣,有效的雲監控就是提升你基礎設施的可視能力並經過服務健康檢查讓問題浮出水面。團隊使用更多的第三方雲應用來管理他們的負載和維護他們基於AWS,GCP或Azure的服務器。數據庫

因此,對於IT和DevOps團隊來講不止須要監控內部應用,網絡和服務器,也須要關注團隊成員使用的第三方應用程序。讓咱們看下哪些不一樣類型的雲服務能夠被監控。緩存

SaaS(軟件即服務):提供某種服務給最終用戶使用的web應用。例如,GoogleDrive,Dropbox,Salesforce等。安全

PaaS(平臺即服務):SQL數據庫,存儲,和緩存工具都在這個類目下。服務器

IaaS(基礎設施即服務): IaaS是指經過AWS,GCP或Azure提供的基於雲上的主機服務。微信

FaaS(函數即服務): 相似AWS Lambda,Azure Functions,或Google Cloud Functions的Serverless應用網絡

應用託管: 在雲環境託管應用的方式。例如Heroku, Amazon EC2, Kubernetes,或Google App Engine都在這裏。架構

雲服務的關注點

  • 安全:
    因爲雲服務的本質,IT和DevOps團隊很擔憂當安全漏洞出現時缺乏控制和可見性。監控,安全和編排/自動化工具能夠幫助檢測這些漏洞,在他們尚未形成大問題時快速定位。
  • 合規:

取決於你的行業或業務,使用雲服務可能有合規風險。你得肯定你對於平臺和服務都很瞭解,保證合規。app

  • 高度集成的服務:

雲服務是被高度集成的,會依賴其餘服務,雲或內部的,才能運轉正常。你得注意當問題發生時,他們可能會影響你技術棧中大量的其餘服務。

  • 運維人員:

若是你常用雲服務,這條可能讓你驚訝。可是,許多管理人員擔憂他們沒法爲團隊配備這些知識來構建和維護可靠的基於雲的服務。

有效雲監控的最佳實踐

  • 肯定盲點:
    深度檢查你的技術棧來發現薄弱點或缺少可視化的痛點。這篇以前的過後覆盤能夠幫你肯定你基礎設施的盲點。
  • 核心性能指標(KPIs):
    一旦你知道你須要監控什麼了,如今你能夠肯定什麼樣的指標能夠用來標識系統監控。使用工具來監控不一樣等級的服務,並優化KPIs保證當故障出現時能夠精確指示出來。對於你KPIs的良好理解可讓你值班時更少的在凌晨2點發出假報警。
  • 中心化可視:
    中心化全部監控數據能夠改善事件檢測,響應和團隊協做。這樣,你能夠獲得一個對於系統健康的全面視圖,能夠將故障事件間更簡單的關聯起來,並能夠更簡單的將其餘團隊也引入到問題處理裏。
  • 成本:
    與你的應用性能或系統健康無關,但跟蹤你在雲服務上的開銷很重要。許多服務開銷是基於使用狀況的,因此頗有必要認識到服務爲團隊提供的價值。
  • 終端用戶監控:
    更好的瞭解用戶是怎麼樣在你的服務間移動的,以及他們的體驗,能夠幫你打造一個更簡便的產品。拿到關於頁面加載次數或服務器響應速度的數據能夠幫你發現你平臺的痛點,幫你打造更強壯的系統。
  • 混沌測試
    時刻記得面向故障構建系統。規劃故障轉移和後備計劃的問題。使用工具來測試當停機或出錯時系統會出現什麼,並重復該過程以便改進它。
  • 優化報警:
    基於你從以上步驟學到的中心化的數據和知識,調整你的報警閾值並保證報警是可操做的並是相關的。

雲監控可用的工具

如今你知道了當監控雲服務時須要作什麼,你如今須要知道怎麼作。因此,咱們會介紹一些在使用雲服務時經常使用的監控工具。

Splunk:咱們可能有偏心,Splunk雲監控提供你雲基礎設施的可視性和詳細日誌分析以及搜索功能。經過監控你技術棧裏從應用託管到SaaS的 全部方案,你能夠生動描繪出你產品里正在發生的事情。

AppDynamics:做爲真正的APM, AppDynamics聚焦於優化你雲應用的性能。基於許多產品和服務,AppDynamics能夠幫你進行終端用戶監控,基礎設施可視化,商業智能,與總體服務可靠性監控。

New Relic:動態地, 持續集成雲環境, New Relic能夠幫你監控應用和基礎設施。不管你運行的是一個簡單架構或使用的是容器,微服務,serverless函數式,New Rlic能夠幫你解決雲監控的需求。

Solarwinds:Solarwinds 雲給你一個關於你雲基礎設施,應用和總體數字化狀況的中心化大圖。識別你係統的缺陷點並可構造一個更好的集成,建壯的使用Solarwinds的基於雲的解決方案。

Amazon CloudWatch:當你使用AWS,Amazon CloudWatch 是一個首選解決方案。它是專門爲AWS的雲化應用打造的監控,你可使用它監控基礎設施,平臺和應用。

結論

不管你是私有云,混合雲仍是全公有云,都須要合適的監控。更好的理解你係統的盲點和薄弱點能夠幫你更好的監控你服務的健康度和使用須要的工具。因此,實施過後覆盤,規劃失敗,測試你的監控工具和應用,並持續優化你的流程來幫助你構建的產品增長可見性和可靠性。


本文來自微信公衆號「麥芽麪包,id「darkjune_think」轉載請註明。交流Email: zhukunrong@yeah.net

相關文章
相關標籤/搜索