開源仍是商用?十大雲運維監控工具橫評

隨着雲計算和互聯網的高速發展,大量應用須要橫跨不一樣網絡終端,並普遍接入第三方服務(如支付、登陸、導航等),IT系統架構愈來愈複雜。快速迭代的產品需求和良好的用戶體驗,須要IT運維管理者時刻保障核心業務穩定可用,而企業運維中的痛點和難點也急需解決。ios

 

一、面向業務的運維,不但關心單點IT資源的運行狀態,更關心整個業務系統的健康狀態sql

二、若是企業使用了大量的API和模塊化應用,那麼關注每一個接口的性能變化狀況和指標shell

三、對於運維主管及企業管理層來講,特別須要上牆的監控大屏數據庫

四、運維須要每週、每個月查看報告趨勢分析,但傳統運維工具數據導出困難apache

五、須要第一時間轉雀和快速發現故障節點,減小業務中斷帶來的損失windows

 

雲智慧對業內主流的開源運維監控系統和商業運維監控系統進行對比,分析各類產品的定位、目標用戶和功能特色,但願幫助廣大運維、開發和創業者找到最適合本身的運維工具。安全

 

開源運維監控產品篇

Zabbix服務器

推薦星級:★★★★★網絡

Zabbix是一個基於WEB界面的提供分佈式系統監控以及網絡監控功能的企業級開源運維平臺,也是目前國內互聯網用戶中使用最廣的監控軟件,雲智慧遇到的85%以上用戶在使用Zabbix作監控解決方案。架構

入門容易、上手簡單、功能強大而且開源免費是雲智慧對Zabbix的最直觀評價。Zabbix易於管理和配置,能生成比較漂亮的數據圖,其自動發現功能大大減輕平常管理的工做量,豐富的數據採集方式和API接口可讓用戶靈活進行數據採集,而分佈式系統架構能夠支持監控更多的設備。理論上,經過Zabbix提供的插件式架構,能夠知足企業的任何需求。

用戶羣:85%以上的泛互聯網企業。

優勢:

1.支持多平臺的企業級分佈式開源監控軟件

2.安裝部署簡單,多種數據採集插件靈活集成

3.功能強大,可實現複雜多條件告警,

4.自帶畫圖功能,獲得的數據能夠繪成圖形

5.提供多種API接口,支持調用腳本

6.出現問題時可自動遠程執行命令(需對agent設置執行權限)

缺點:

1.項目批量修改不方便

2.社區雖然成熟,可是中文資料相對較少,服務支持有限;

3.入門容易,能實現基礎的監控,可是深層次需求須要很是熟悉Zabbix並進行大量的二次定製開發,難度較大;

4.系統級別報警設置相對比較多,若是不篩選的話報警郵件會不少;而且自定義的項目報警須要本身設置,過程比較繁瑣;

5.缺乏數據彙總功能,如沒法查看一組服務器平均值,需進行二次開發;

6.數據報表須要特殊二次開發定義;

 

Nagios

推薦星級:★★★★☆

Nagios是一款開源的企業級監控系統,可以實現對系統CPU、磁盤、網絡等方面參數的基本系統監控,以及SMTP,POP3,HTTP,NNTP等各類基本的服務類型。另外經過安裝插件和編寫監控腳本,用戶能夠實現應用監控,並針對大量的監控主機和多個對象部署層次化監控架構。

Nagios最大的特色是其強大的管理中心,儘管其功能是監控服務和主機的,但Nagios自身並不包括這部分功能代碼,全部的監控、告警功能都是由相關插件完成的。

用戶羣:適合複雜IT環境的企業

優勢:

1.出錯的服務器、應用和設備會自動重啓,自動日誌滾動

2.配置靈活,能夠自定義shell腳本,經過分佈式監控模式

3.支持以冗餘方式進行主機監控,報警設置多樣

4.命令從新加載配置文件無需打擾Nagios的運行

缺點:

1.事件控制檯功能很弱,插件易用性差

2.對性能、流量等指標的處理不給力

3.看不到歷史數據,只能看到報警事件,很難追查故障緣由

4.配置複雜,初學者投入的時間、精力和成本比較大

 

Ganglia

推薦星級:★★★★☆

Ganglia是加州大學伯克利分校發起的一個開源集羣監控項目,設計之初是用於監控數以千計的網絡節點。Ganglia是一個跨平臺可擴展的,高性能計算系統下的分佈式監控系統。它已被普遍移植到各類操做系統和處理器架構上。

用戶羣:適用於大型服務器集羣用戶。

優勢:

1.適合監控系統性能,經過曲線很容易見到每一個節點的工做狀態

2.能夠自定義監控項,監控展現有表格和圖像兩種,支持手機版

3.部署方便,經過不一樣的分層管理上萬臺機器,無需逐個添加配置

缺點:

1.沒有內置的消息通知系統

2.沒有報警機制,出現問題不可以及時報警

 

Zenoss

推薦星級:★★★★☆

Zenoss Core是Zenoss的開源版本,其商用版本爲Zenoss Enterprise。做爲企業級智能監控軟件,Zenoss Core容許IT管理員依靠單一的WEB控制檯來監控網絡架構的狀態和健康度。Zenoss Core的強大能力來自於深刻的列表與配置管理數據庫,以發現和管理公司IT環境的各種資產。Zenoss同時提供與CMDB關聯的事件和錯誤管理系統,以協助提升各種事件和提醒的管理效率。

優勢:

1.Zenoss比較出色的地方在於它的Dashboard,能夠配置不少portlet

2.每一個用戶的界面都是分開管理的,自定義dashboard不會影響其餘用戶

3.強大監控功能支持服務器、路由交換、防火牆、存儲、數據庫、中間件監控

4.採用基於HBASE的opentsdb存儲任意時間段的數據

5.將狀態監控,性能監控,資源管理,良好的報告機制進行有機的整合

缺點:

1.對資源要求較高,即便只管理少數幾臺設備,也須要消耗大量硬件及內存等附加資源。

2.針對windows系統,開源版只提供SNMP,經過WMI檢測CPU,Disk,軟硬件和性能只在收費版提供。

 

Open-falcon

推薦星級:★★★☆☆

Open-falcon是小米運維團隊從互聯網公司的需求出發,根據多年的運維經驗,結合SRE、SA、DEVS的使用經驗和反饋,開發的一套面向互聯網的企業級開源監控產品。

Open-falcon架構

用戶羣:目前有幾十家企業用戶不一樣程度使用。

優勢:

1.自動發現,支持falcon-agent、snmp、支持用戶主動push、用戶自定義插件支持

2.支持每一個週期上億次的數據採集、告警斷定、歷史數據存儲和查詢

3.高效的portal、支持策略模板、模板繼承和覆蓋、多種告警方式、支持callback調用

4.單機支撐200萬metric的上報、歸檔、存儲

5.採用rrdtool的數據歸檔策略,秒級返回上百個metric一年的歷史數據

6.多維度的數據展現,用戶自定義Screen

7.經過各類插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交換機監控。

缺點:因爲發佈時間較短,不少基礎的服務監控插件(如Tomcat、apache等)還不支持,不少功能還在不斷完善中,另外因爲缺乏專門的支持,雖然有開放社區,可是解決問題的效率相對較低。

 

商用運維監控系統篇

監控寶

推薦星級:★★★★★

監控寶是雲智慧爲用戶提供IT性能監控(IT Performance Monitoring)的SaaS產品,包含網站監控、服務器監控、中間件監控、數據庫監控、應用監控、API監控和頁面性能監控等功能。包含免費版、暢享版和企業版,目前用戶約40萬,監控寶app也是國內惟一提供移動監控服務的產品。

用戶羣:覆蓋電子商務、移動互聯網、廣告傳媒、在線遊戲、教育醫療等行業的幾十萬用戶,小米、陌陌、高德、用友、金山、途牛、聚美優品、陸金所、中國平安、建行信用卡中心、春雨醫生、暢遊、國家電網、中國電信、滴滴打車、春秋航空、鳳凰網等各行業領先企業和中國互聯網百強企業超過30%在使用監控寶。

優勢:

一、 做爲國內最先提供基於SaaS服務的網絡監控平臺,監控寶不但爲初級用戶提供免費的標準服務,企業用戶還能夠按需購買所需的監控、告警資源,最大限度的節省企業運維成本;

二、 監控寶經過遍及全球的300多個分佈式監測節點,對網絡進行穩定性和可用性的主動監控和實時分析,支持http(https)、ftp、ping、udp、tcp、smtp、traceroute等多種協議,測量CDN效果及DNS狀態,全網全地域性能趨勢分析。

三、 實時捕捉服務器深層性能指標,支持Linux/Unix/Windows系統及雲平臺,支持CPU使用率、CPU平均負載、內存使用比例、磁盤IO、磁盤空間使用率、網絡流量和系統進程數統計等物理指標及30多種應用服務,雲主機監控端一鍵開啓,無需複雜配置。對於應用服務的監控,監控寶已經支持常見的應用類型包括:Apache、Lighttpd、Nginx、Tomcat、IIS、Memcache和Redis,存儲層監控支持Hadoop、MySQL、MongoDB、SQLServer、Oracle的健康狀態及性能監控。

四、 監控寶是國內目前惟一支持API監控的網絡監控產品,經過API接口調用模擬用戶使用過程,支持對get、post、put、delete、head、options六種請求方式進行實時監控;支持JSON、XML、Text、Response Status驗證及Postman腳本導入。

五、 Docker監控也是監控寶的獨家功能,可以實時監控Docker容器的CPU、內存、網絡流量及Swap狀態,讓開發者和運維人員在使用Docker時清晰掌握其資源消耗情況。

六、 監控寶提供頁面性能管理,基於國際標準制定頁面性能指數,識別加載元素的狀態及正確性,對全網全用戶加載響應時間分析,同時準肯定位問題元素及優化建議。

七、 及時有效的告警通知對運維來講相當重要,監控寶能夠根據SLA設置告警閾值,第一時間發送告警通知。監控寶覆蓋最全面的告警通知方式:電子郵件、短信、電話語音、URL回調通知、App Push等。另外監控寶提供分級告警通知,可以根據告警事件的不一樣等級將不一樣的告警推送給不一樣的人員,支持企業分層管理!

八、 監控寶目前對其Smart Agent進行了開源,用戶能夠根據業務需求定製化開發Agent,同時用戶的數據安全獲得保障。

九、 監控寶提供私有化部署解決方案,知足政企、金融行業專有網絡監控的需求。

十、 來自Compuware、CA、IBM等企業IT服務資深專家,超過5年的本土化企業級SaaS服務經驗,以及超過百人的技術服務團隊,爲用戶提供最佳的服務保障。

 

360網站服務監控

推薦星級:★★☆☆☆

360網站服務監控是一款面向廣大站長的網站監控產品,提供免費的網站、服務器監控。

用戶羣:我的站長

優勢:

一、 服務免費,支持網站HTTP監控、PING監控、域名DNS監控和服務器監控

二、 提供網站訪問全景數據和簡單配置信息

缺點:

一、 只支持簡單的網站和服務器監控,歷史數據保留15天,且免費監控點數量僅爲四個

二、 最後一次產品更新是2014年9月,目前已中止更新和運營支持

 

阿里雲監控

推薦星級:★★★★☆

阿里雲監控是一款免費網站監控產品,可監控站點和服務器,並提供多種告警方式:短信,旺旺,郵件。

用戶羣:阿里雲用戶

優勢:

一、 與阿里雲服務捆綁緊密,容許用戶自定義數據監控

二、 阿里雲多IDC間內網數據傳輸,不佔用客戶公網資源

三、 支持對業務數據的通用統計,從各個角度反應服務的運行狀況

缺點:

一、 全部服務基於阿里雲,功能單一,擴展性差

二、 功能不夠強大,只能知足基礎監控需求

 

百度雲觀測

推薦星級:★★☆☆☆

百度雲觀測是百度推出的一款雲服務產品,相似於360雲監控、阿里雲監控,主要是爲站長提供免費的一站式網站監測、預警服務,功能覆蓋網站運行情況、安全和訪問速度等多個方面。

用戶羣:我的站長

優勢:

1. 對於用戶每日訪問的站點進行安全檢測

2. 國內各大城市雲節點覆蓋,支持CDN、DNS狀態和主機監控

缺點:

1. 須要進行網站認證

2. 監控點少,功能簡單,只能監測網站狀態,不支持服務器、應用監控。

 

小蜜蜂網站監測

推薦星級:★☆☆☆☆

小蜜蜂網站監測是一款針對中小企業需求開發的綜合測量網站運營狀況線上工具,能夠定時監控網站或服務器器的可用率(Uptime),一旦網站沒法連結、或是服務器發生錯誤,便可發送告警通知。

用戶羣:中小企業網站管理員

優勢:

1. 小蜜蜂經過探測節點和Last Mile兩種模式監測網站可用性,支持多種站點監控類型和不一樣的網絡訪問傳輸協議;

2. 提供多樣化監控告警設置,並支持站內實時告警消息,支持RSS。

缺點:

1. 只支持基本的網站監控,監控點不可選,監控服務不穩定;

2. 網站性能歷史數據不夠詳細,且沒法導出。

隨着新技術的不斷髮展,雲服務已經互聯網企業的必須,可是長期以來會存在傳統物理主機和雲主機、私有云和公有云並存的狀態。此外,互聯網企業的發展速度很是快,小米、滴滴出行等不少企業都是在短短几年內發展起來的,所以選擇一款合適的雲監控產品,伴隨企業同步成長,是很是必要的。

相關文章
相關標籤/搜索