CloudCare容器技術白皮書

DevOps的方法論已經廣泛應用到各種有開發,測試,運維團隊的場景中,實際落地案例下在資源編排,容器集羣管理,鏡像倉庫管理,容器服務監控上有大量的技術平臺和技術棧組合。結合CloudCare在大量企業客戶場景下的實際案例,本文整理輸出了我們的技術白皮書。
_1

容器服務架構

基於上圖的容器服務架構,整體CI/CD的Pipeline如下所示:

_2

CI/CD技術棧

平臺搭建實施涉及內容

  • 環境快速部署,整體交付和管理
  • 應用服務CI/CD配置
  • 容器調度規則與健康檢查
  • 黑盒&白盒監控

    • 基礎資源
    • 容器狀態
    • 業務日誌
  • 故障快速定位和排查,自動/手動修復
  • 日誌分析,預測和業務運營支撐
  • 運營大屏接入

容器管理平臺自動化部署

  • 應用Stack、Catalog
  • 管理賬號和權限,LDAP接入
  • Gitlab CE,包括 CI/CD配置
  • 私有鏡像倉庫Registry
  • 應用配置中心
  • 應用日誌中心
  • 監控中心
  • 基礎設施管理配置
  • 操作審計平臺搭建配置
    _3

監控告警體系

監控告警

黑盒和白盒監控,黑盒監控面向現象,代表目前正在發生的,即「系統現在有故障」,白盒監控依賴對系統內部信息的檢測,如系統和業務日誌,可以檢測即將發生的問題。CloudCare採取的策略是以白盒監控爲主,在關鍵點位結合使用黑盒監控。監控和告警展示效果如下:

_4

監控示例

結合以上涉及的相關平臺和技術棧,CloudCare在落地到實際客戶案例中會有靈活變化,例如在CI環節可以選擇基於Gitlab-runner來做,也可以基於Jenkins來實施;在資源編排上可以用自建的kubernetes集羣,也可以選擇阿里雲kubernetes容器服務(除了Serverless版本)。