Rainbond V3.7.1 發佈,零配置支持全方位集羣資源監控與報警

Rainbond是一款以應用爲中心的開源PaaS,由好雨基於Docker、Kubernetes等容器技術自主研發,可做爲企業在公有云或私有云環境下的應用交付平臺、DevOps平臺、自動化運維平臺和行業雲平臺,或做爲企業級的混合雲多雲管理工具、Kubernetes容器管理工具或Service Mesh微服務架構治理工具。

繼Rainbond V3.7.0版本大量提升平臺穩定性更新後,咱們又推出了V3.7.1版本,本次更新進一步完善集羣全方位的監控與報警體系。Rainbond集羣須要監控的目標分爲三類:html

  • 節點操做系統和硬件指標

    Rainbond每一個節點的資源使用狀況和健康情況的監控和快速發現故障對於Rainbond運維人員來講是很是必要的。Rainbond Node服務集成了node-exporter,運行於全部節點之上,暴露出通過精簡的Prometheus規範的操做系統和硬件的指標。node

  • 管理服務監控指標

    Rainbond全部服務和第三方服務都提供了Prometheus的exporter API,以暴露當前服務的關鍵監控指標。git

  • 應用容器資源指標

    應用運行的實例容器的資源佔用狀況(內存、CPU、IO、Net)雖然不能直接體現應用的負載狀況,但能夠配合應用業務級性能分析定位應用問題。容器的監控具備特殊性,容器是一個飄忽不定的監控目標。應用是肯定的。所以Rainbond監控的維度是應用級容器。當前版本採用收集Kubelet集成的Cadvisor收集的容器監控指標。但其因爲監控指標比較豐富,大多數狀況下監控系統會冗餘大量無用數據。Rainbond後續版本將精簡容器監控指標。github

Rainbond 提供了rbd-monitor組件,組件由monitor進程服務和Prometheus服務組成。monitor服務有如下幾方面工做:docker

  • 自動發現三方面監控目標。
  • 自動生成監控目標Prometheus配置並生效。
  • 提供配置報警規則的API服務,並自動設置Prometheus生效。用戶能夠經過grctl命令方便設置報警規則。
  • 自動對監控目標進行自動分類,集羣統籌數據分區,以解決單機監控目標數有限問題。[TODO]
  • 對外提供集羣負載的查詢API, 屏蔽底層Prometheus的數據分區差別,相似於項目thanos [TODO]

Rbd-monitor提供的查詢API, 數據顯示方面可對接Grafana進行可視化,對接Altermanager進行報警信息處理。微信

instance-monitor

<center>應用實例內存使用佔比</center>架構

instance-monitor

<center>容器資源監控</center>app

instance-monitor

<center>操做系統和硬件指標監控</center>運維

instance-alerting

<center>報警規則</center>svn

除此以外,當前版本還帶來了一系列改進:進一步優化源碼構建體系,支持SVN基於Tag方式構建應用、支持Maven的子項目構建、改進源碼構建容器的建立策略,使用原始代碼建立容器替換掉調用docker run命令以解決以前版本關於複雜構建變量沒法傳入的問題。爲方便用戶調試源碼,支持使用grctl工具對源碼進行脫離平臺的檢查和構建。經過簡單的命令快速驗證源碼是否符合Rainbond要求。

另外,借鑑廣大企業用戶對於Rainbond產品的使用體驗的反饋,支持了應用的批量刪除與批量移動組別、優化日誌推送與存儲、支持更改數據中心內部倉庫域名等功能。

具體更新清單以下:

新增功能

  1. 增長應用實例所建立容器的資源指標 【文檔】
  2. 增長節點操做系統和硬件指標監控 【文檔】
  3. 增長各服務組件健康監控 【文檔】
  4. 增長應用異常事件的查詢與處理 【文檔】
  5. 增長控制檯可視化應用每一個實例的內存使用狀況 【文檔】
  6. 增長支持自定義Prometheus報警規則 【文檔】
  7. 增長monitor組件與Alertmanager的對接支持 【文檔】
  8. 增長對SVN基於Tag版本選擇構建的支持 【文檔】
  9. 增長支持更改數據中心內部倉庫域名 【文檔】
  10. 增長批量刪除應用,批量移動分組功能 【文檔】
  11. 增長grctl命令行工具支持源碼構建測試 【文檔】
  12. 改進操做日誌和構建日誌的推送與存儲
  13. 改進源碼構建容器的構建策略,支持更多的參數傳入

已知問題修復

  1. 應用導出時存在的bug
  2. grctl獲取應用信息時的信息缺失
  3. 自動部署提供的URL錯誤
  4. 解決了應用備份因爲版本不存在致使的bug

關於Rainbond 5.X的RaodMap的草案討論

Rainbond至開源以來,深受社區用戶的歡迎,已經有大量企業用戶嘗試使用Rainbond做爲企業產品開發,架構,運維和交付的重要基礎平臺。Rainbond在經歷了3.X 系列7個版本的迭代週期之後,即將進入5.X版本週期。Rainbond團隊將在Rainbond 5.X體系中深刻與社區生態結合。你是否關注PaaS、Kubernetes, 微服務架構領域呢?

點擊查看並參與Rainbond 5.X版本規劃:

About Rainbond 5.X RoadMap Community needs collection

瞭解更多

相關文章
相關標籤/搜索