隨着網絡方案的不斷擴展與多元化走勢,大量有線及無線設備開始成爲網絡體系不可或缺的組成部分,用戶對網絡監控工具的需求也隨之持續走高。雖然功能豐富的商業產品比比皆是,但來自開源社區的強大方案仍然對監控工具市場的發展起到巨大的推進做用。html
在本系列文章中,咱們將一同剖析四款高人氣開源產品--Nagios Core 3.五、NetXMS 1.2.七、OpenNMS 1.10.9以及Zenoss Core 4.2。四款產品都已經至關成熟,足以提供與其它企業級同類方案相媲美的綜合性監控能力,同時擁有良好的社區支持體系。ios
四款產品都提供管理、性能監控以及網絡設備警示與報告功能,其做用範圍涵蓋服務器、路由器、交換機、打印機、UPS、網絡站點、業務應用程序以及移動設備等等。監控功能能夠簡單起效,用戶能夠像使用PING請求那樣利用SNMP(即簡單網絡管理協議)或者本地代理對單一設備進行全面管理。web
這次參與評述的四款產品經實測所有支持SNMP及其它通用型協議,包括WMI、HTTP、SMTP、SSH以及XML。儘管其中兩款產品只能用於特定操做系統,但四者所有能夠實現跨平臺IT基礎設施監控(本質上說可做用於任何擁有IP地址的設備)。它們支持的功能包括自動識別、SNMP、可閱讀系統日誌、觸發器/警報設置、Web應用程序、分佈式監控(即負載平衡)、映射、IPv6(只有NetXMS不支持IPv6)以及庫存追蹤。數據庫
四款產品還提供基本而全面的基礎設施監控功能,並且不多甚至徹底不須要額外硬件、內存以及存儲機制做爲監控環境的支持基礎。在本次評述中,咱們將從安裝便捷性、配置便捷性、管理能力、多平臺支持能力、報告機制及整體可用性等幾個角度作出橫向比較。後端
第一位競爭者:Zenoss瀏覽器
Zenoss堪稱咱們的首選方案,這主要是因爲其直觀且專業的管理界面對於用戶極具吸引力。另外,其環境配置與報告運做機制也很是簡便;當須要幫助時,咱們找到的用戶指導文檔很是翔實清晰--出色的說明資料在開源領域極爲可貴。但完美永遠只是目標卻沒法真正達成,咱們發現Zenoss對資源要求較高,即便只管理少數幾臺設備、它也須要消耗大量硬件及內存等附加資源。服務器
Zenoss Core是一款開源網絡管理工具,能夠運行在紅帽企業Linux(簡稱RHEL)或者社區企業操做系統(簡稱CentOS)兩大Linux版本當中。另有一套虛擬設備版本,可以利用VMware Player運行在最小安裝配置下的CentOS當中。Zenoss Core基於Gnu GPL2許可。除了開源版本以外,Zenoss還提供多套商業監控解決方案。網絡
Zenoss不須要搭配代理,且使用SNMP、SSH、Telnet以及WMI等現有協議。在識別過程當中,Zenoss會收集個別設備的組件信息並概括其潛在運行依賴關係,經過這種方式建立出的基礎架構清單被稱爲"配置模型"、這也正是Zenoss網絡管理方案的核心所在。架構
除了使用自動識別功能以外,管理員還能夠手動輸入信息並將監控的ZenPack數量調整至200以上,從而拓展單一或多臺設備所搭配的配置模型。ZenPack從使用層面看相似於開源免費社區所開發的功能性插件。Core ZenPack被打包在Zenoss Core版本當中,而商業版ZenPack則只會出如今商業版本中。分佈式
在解決了一系列硬件需求與依賴關係問題後,咱們最終成功在運行着CentOS 6.4最小化版本(無圖形用戶界面)的虛擬機中安裝了Zenoss 4.2。咱們發現Zenoss在設計思路上並無考慮輕量級基礎設施的配置現狀--事實上最少要6GB內存才能讓一臺僅安裝了操做系統和Zenoss的設備進入正常運行狀態。Zenoss資源密集型方案的頭銜可謂實至名歸,它可以監控多達一千臺設備,且建議配置爲最少16GB內存與八個CPU核心,存儲空間和傳輸速度也是越強越好。
Zenoss可以監控多種操做系統平臺,其中包括網絡設備(例如路由器與交換機)、服務器以及特定應用程序。它採用分層式架構:用戶層、數據層、處理層與採集層。用戶層基本負責提供用戶界面,數據層則負責從三個不一樣的數據庫中收集數據,處理層管理採集層與數據層之間的通訊工做,採集層利用一系列服務向數據層提供收集到的數據。
可用性監控的實現依賴於一系列手段,例如利用ICMP或者SNMP響應對TCP/IP端口及服務進行測試及查詢。Zenoss還可以對Windows及Linux流程及服務進行可用性檢測。
Zenoss經過收集SNMP OID值的方式實現性能監控。整個過程須要藉助預加載MIB(即管理信息基礎)、新的本地MIB以及對定製性能插件的內置支持等機制。
安裝完成以後,Zenoss就能像物理設備那樣接受來自不一樣設備(包括臺式機、筆記本及移動設備)瀏覽器的訪問。其用戶界面高效而直觀,在默認狀況下會顯示警示信息以及基礎設施地理位置。用戶還能夠經過配置在瀏覽器中查看任何URL、內部或外部頁面。儀表板中顯示的信息能夠經過開發者提供的所謂「門戶組件」進行調整,各項目的對應顯示窗口也可隨時添加、刪除並在儀表板內部任意拖拽及調整窗口尺寸。這樣的開放性讓咱們可以爲所欲爲定製出符合須要的選項。「守護進程關閉」、「消息」與「生產狀態」等功能也擁有對應的門戶組件。
在向監控工具中添加設備時,你們可使用自動識別功能或者手動輸入設備的IP地址或主機名稱。在設備添加完成以後,具體項目會顯示在「基礎設施」選項卡中、並附帶狀態基礎信息與彩色編碼提示。
除了"基礎設施"以外、"事件"選項卡中顯示的基本屬於同類信息,但只按事件進行排序。事件與基礎設施兩種標籤使管理員可以經過輸入數列標題對大部分數列加以分類。對於每一個事件,你們能夠執行不一樣的處理操做,包括「只應答事件但不實際執行」及向設備發出「手動ping」或者「snmpwalk」指令以檢索更多信息等。事件一旦處理完成,Zenoss會將其關閉並進行歸檔。
Zenoss Core提供強大的報告功能,從基礎的準備就緒報告到定製報告功能應有盡有。除了標準的事件、設備及性能報告以外,Zenoss還還提供完善的圖形化報告,包括在同一份報告中包含多份彙總自多臺設備的圖形化報告。這些報告可在屏幕中顯示、打印在紙面上或者被保存爲PDF文件。
目前已經有大量第三方ZenPack可供下載,其中一些甚至容許用戶實現Zenoss與移動Android設備間的交互需求,咱們也能夠利用由Zenoss提供的API說明文檔建立屬於本身的ZenPack。
雖然Zenoss Core對於系統配置的要求頗爲嚴苛,但這也使得整套監控環境在性能上極爲強大、足以處理規模化設備與數據流量。Zenoss的用戶界面靈活而富於現代氣息,豐富的選項與定製化儀表板使人印象深入。不管是顯示在屏幕上仍是打印成PDF形式,其統計報告都極具綜合性且信息排布層次分明。另外,咱們還要再次掌握Zenoss那超過兩百頁的PDF用戶手冊,面面俱到的內容與清晰明瞭的指導在開源領域極爲可貴。
第二位競爭者:OpenNMS
OpenNMS是一款強大的網絡管理工具,可以運行在大多數平臺之上且足以應對大規模數據的管理工做,其定製儀表板功能尤爲使人讚歎。因爲已經獲得普遍普及,目前已經有超過一萬五千款插件可供用戶選擇。
做爲一款基於Java的跨平臺產品,OpenNMS可以運行在任何支持Java SDK 1.6及更新版本的平臺上。OpenNMS基於GNU GPL許可,開發團隊還提供商業許可及相關技術支持。OpenNMS的核心功能包括二層及三層鏈接自動識別、網絡自動識別、自動配置以及服務識別等。在最新版本中,這款工具還添加了對IPv6的支持能力。OpenNMS擁有一套內置網絡服務器系統,用戶經過內置用戶列表、LDAP或者RADIUS協議實現身份驗證。
除了建立自有事件,OpenNMS還能夠從SNMP、HTTP、WMI、XML、JMX以及系統日誌等外部協議中接收性能數據。從服務監控方面來看,它可以與一系列經常使用協議及服務進行通訊,包括DNS、Windows服務狀態、BGP會話、思傑、郵件協議等等,這還只是其通訊對象中的一小部分。目前已經有一百多家廠商爲其開發出超過一萬五千款trap,其中SNMP trap接收器可以在設備啓動後爲其提供大量實用功能。
咱們能夠經過多種方式實現通知推送目的,包括利用標準頁面調度程序、郵件通知機制以及更具定製特點的微博(例如Twitter)與命令行呼叫等方式。在整合性方面,它可以與DNS交互、接收並上傳節點信息,還可與Hyperic HQ、RANCID以及Asterisk電話平臺等第三方產品進行交互。
最後,OpenNMS還提供多種報告選擇,用戶能夠經過預先配置調整報告機制或添加以日期範圍爲基礎的篩選方案。報告能夠在指定時間運行,其結果會被保存到文件系統中或經過電子郵件發送至特定收件人。生成的文件格式分爲PDF與CSV兩種。
OpenNMS的最低系統要求很是親民,只須要512MB內存。但若是要讓整套系統有能力應對任何數據採集任務,那麼用戶仍然須要在處理器、內存以及存儲配置方面進行大幅強化。
因爲該工具圖形用戶界面所採用的JSP頁面屬於動態編譯,所以除JRE以外、OpenNMS還必須配合完整的Java SDK才能正常運行。再有,PostgreSQL也必須提早安裝就緒。
咱們將OpenNMS做爲獨立服務器安裝在Windows系統當中,並利用Web圖形用戶界面在瀏覽器中進行管理操做。在登陸以後,主頁面會顯示關於基礎設施的一些基本信息,例如各節點在過去24小時中的停機或者可用狀態,並額外提供專門的區域用於訪問與報告功能。你們在屏幕上方的水平連接欄中還能找到其它導航機制。
OpenNMS主要利用兩種特定配置方式向監控體系中添加新功能,即自動識別與定向識別。咱們先經過一系列參數設定讓OpenNMS瞭解如何根據需求識別基礎設施,你們能夠在"識別配置"中輸入URL、特定的IP及IP地址範圍並設定例外狀況的方式調整其識別機制。值得一提的是,大部分OpenNMS配置信息都被以XML格式保存在文件中,熟悉XML的用戶能夠直接在對應文件中進行修改、而沒必要使用圖形用戶界面。
在配置過程當中,咱們發現用戶須要常常查閱在線說明文檔(好在指導材料還算全面),不然不少任務根本沒法完成。之因此面臨諸多挑戰,是由於咱們對於OpenNMS所使用的基礎設施技術術語不夠熟悉。從理論角度講,節點應該會被自動識別並添加到監控體系當中,但因爲咱們的測試實驗室擁有許多故意隔離出來的節點,所以這部分配置工做只能經過手動方式完成。
全局導航對於咱們來講不太符合邏輯,不過咱們認爲各個環節與屏幕信息在整合以後會使其獲得改善。也許這只是由配置引發的小問題,但咱們發如今打開警報、事件或者通知選項卡後,屏幕上確實不會顯示任何內容--除非你們進行搜索或者點擊查看全局連接。
不過咱們清楚,對於大型基礎設施來講除非與篩選工具配合使用、不然屏幕上直接顯示出的基礎信息幾乎沒什麼實際價值。咱們在登陸後只能看到採用儀表板風格的屏幕, 並且須要點擊OpenNMS以返回管理面板。咱們還能夠點擊連接激活另外一個儀表板界面,其中提供一部分關於基礎設施的簡要信息,但經過橫向比較、咱們發現這套方案效果平平。
咱們對於搜索功能很是讚揚,而OpenNMS也確實在搜索功能的可用性方面下足了功夫。咱們尤爲喜好以節點爲單位搜索DNS或者POP3等特定服務這一功能。另外一項實用功能在於對與資產(包括位置、操做系統及運行狀態)相關的數據字段進行搜索。
OpenNMS的報告功能很是全面,其中包含大量預建立模板並可以運行臨時報告。報告可被輸入到屏幕中或者以PDF及/或CSV格式彙總成文件。
咱們發現OpenNMS的用戶界面須要通過必定調整才能知足大部分使用者對直觀性的需求,但隨着對界面的愈發熟悉、咱們的注意力更多集中在了這款產品出色的功能身上。管理員界面提供大量實用信息,相信能很快獲得你們的確定。咱們也喜歡它帶來的建立只讀儀表板的功能。搜索功能很是強大,彩色編碼警報也效果顯著。整體來看,OpenNMS確實是一款可以支持多種平臺的出色管理工具。
第三位競爭者:NetXMS
此次咱們一塊兒來看NetXMS。這是一款用戶界面有些凌亂、但卻擁有豐富工具集的產品,不只能對基礎設施進行細化管理、並且在移動方面傾注了大量心血。
NetXMS能夠運行在Windows 2003及更新版本、Linux、Solaris、AIX、HP-UX以及FreeBSD等多套系統平臺之上,並遵循GPL許可機制。
NetXMS的最大特點就是能在不借助外部插件的前提下以原生方式支持大量主流平臺。NetXMS可以使用SNMP以及本地"高性能"代理、從而收集數據並將結果提交併保存至SQL數據庫中(包括甲骨文、微軟SQL Server、PostgreSQL、MySQL以及SQLLite)。咱們能夠經過自動或者手動方式實現二層與三層網絡基礎設施識別。收集到的數據會被保存在監控服務器中,並由管理員經過多種方式加以訪問。
數據收集由對象/節點負責,並且每一個對象/節點都擁有與自身相關聯的閾值限制,例如服務器內存利用率或者路由器流量限值等。一旦超出閾值,NetXMS會直接觸發某些事件;而隨着閾值的回落,系統則繼續觸發正常業務事件。NetXMS還支持Android,既能夠對Android設備進行管理、又能夠做爲設備監控的代理機制。
除了在屏幕上顯示通知及警報信息,NetXMS還容許管理員經過配置發送警報短信及電子郵件。具體事件也可被轉發至另外一臺NetXMS服務器或其它外部系統。NetXMS還具有本地腳本引擎,旨在實現高級自動化與管理功能。
NetXMS的系統配置要求簡直可謂沒有要求--只須要512KB內存與主頻低於1GHz的處理器。不過對於大部分生產安裝環境來講,主機操做系統還須要額外的CPU處理核心/強度/速率以及更大的內存容量。要安裝在Windows系統中,咱們還須要爲其準備一套單獨的數據庫服務器,用於保存配置設定以及數據收集(支持PostgreSQL、MySQL、甲骨文或者SQL Server)。某些PDF說明文檔已經有些過期(官方網站也已經明確提示了這一點),但咱們發現維基百科可以起到很好的指導做用。
在測試環境中,咱們將NetXMS安裝在運行着PostgreSQL管理方案的Windows Server 2008 R2系統中,同時配備一套基於Java的桌面界面、Web界面或者移動管理控制檯。NetXMS還會同時安裝本身的輕量級web服務器,這樣你們就沒必要再安裝IIS、Apache或者其它web服務器了。不過各位千萬不要把Web界面安裝在NetXMS所在的目錄中,這樣會致使工具安裝失敗、至關於搬起石頭砸本身的腳。不過安裝導航會默認將兩者裝在同一個目錄中,這多是供應商的失誤。
NetXMS管理控制檯的既定目標之一在於提供一套統一化跨平臺圖形用戶界面(包括Web界面),從這個角度來看NetXMS無疑得到了極大成功。
雖然咱們也在獨立的臺式機上測試過Web用戶界面,但本次測試的大部分工做都利用了運行在服務器上的桌面應用程序。登陸以後,工做臺就成了咱們的主要視圖界面,用戶能夠經過不一樣的自定義方式對其進行調整,並將保存結果用於將來的會話過程。初一上手,用戶界面上的大量標籤與連接可能會讓新手們感到不太適應。
要實現完整的自動識別功能,供應商建議咱們讓工具對大型網絡進行幾個小時乃至一整夜的全局掃描。因爲咱們的測試環境規模不大,所以整個識別過程耗時並不太長(不到30分鐘)。你們也能夠經過一系列簡單步驟手動添加節點。節點添加完成後,NetXMS將在"事件狀態"窗口中顯示節點的基本信息,例如某個進程沒法正常工做或者某個節點處於不可用狀態。此外,工具還提供多個數據鏈接項(簡稱DCI),容許用戶針對每一個節點進行自定義配置或者將配置方案保存在模板並推廣到整個網絡當中。這樣若是須要對配置進行總體修改,咱們就沒必要在每一個節點中重複折騰。
屏幕報告功能給咱們留下了深入印象,該功能容許用戶運行一系列臨時報告;報告結果所產生的數據集可被導出爲CSV文件。NetXMS還集成了Jaspersoft報告引擎,從而實現了建立自定義報告並在必要時加以重複使用。
整體而言,NetXMS是一套功能強大的管理工具,但在配置方面頗具挑戰,由於設定與控制佈局過多使整個調整邏輯顯得有些混亂。用戶手冊也還不錯,但具體內容應該再從新整理一遍。另外一項不足之處在於,管理控制檯應該提供與當前狀況相關的幫助機制。
從積極的角度看,咱們對NetXMS的跨平臺能力、移動設備支持能力以及在移動設備中運行管理控制檯的能力深表讚揚。便捷的自定義儀表板建立功能只需幾回鼠標點擊便可完成,可以幫助用戶以可視化方式掌握網絡運行狀態。
第四位競爭者:Nagios
Nagios對於基礎設施規模不大的小型企業而言很是理想,在它的幫助下技術團隊無需像大型企業那樣花費大量時間經過命令行對節點加以配置。
早在上世紀九十年代末Nagios就已經誕生,儘管最初是針對Linux所設計、但它在Unix平臺上的運行情況一樣出色。Nagios Core是一款遵循GNU通用公共許可的開源軟件,另有Nagios企業版爲用戶提供商業技術支持。
Nagios可以監控包括SMTP、POP三、HTTP、NNTP以及PING在內的多種網絡服務。它還會追蹤主機資源的使用狀況,例如處理器負載、內存及磁盤使用量等。利用自定義插件,用戶可以開發出本身的服務檢查方案。Nagios Core與以前提到的幾款工具備所不一樣,其Core版本與市場上的其它商業產品相比縮水比較嚴重。
若是想使用SNMP trap或者移動應用等功能,你們必須採購其"專業版"或者"商務版",然後端數據庫選項則只在"商務版"中提供。"學生版"雖然僅僅售價50美圓,但也只提供了快速入門指南、一套預配置虛擬機外加Web配置圖形用戶界面等基本功能。免費版本更是至關寒酸,只包含開源監控引擎。
HTTP、FTP以及SMTP等公共服務可以在不部署主機代理或者依賴於SNMP的前提下受到,但任何"私有"服務--例如CPU與內存使用率、用戶信息、服務狀態及運行流程等--都須要經過在主機上安裝代理方可實現。針對不一樣類型的主機,供應商也提供不一樣種類的代理機制,例如Windows服務器、Linux/Unix服務器、打印機、路由器與交換機等。除了安裝代理以外,你們還須要更新一系列配置文件以順利啓動監控工具。Nagios Exchange網站提供大量可選插件,足以知足用戶在實際監控/管理工做中的不一樣需求。
在通知功能方面,Nagios可以經過電子郵件或者手機短信發送警示信息,並有專門的系統根據問題的嚴重程度向不一樣我的及小組傳達狀況。
Nagios Core必須運行在Linux或者Unix的衍生系統環境下,若是要使用Web界面(也就是CGI,即計算機生成界面)、咱們還須要準備一臺web服務器(最好是Nagios與Apache一一對應)。
準備好前續工做後,咱們須要從快速入門指南開始着手Nagios Core的安裝工做。在咱們的實際測試中,指南計劃很快擱淺--由於咱們選擇Linux最新版本根本不在供應商的支持範疇以內。爲了完成測試,咱們不得不依靠第三方在線資源的指引將Nagios Core安裝在CentOS 6.4版本中。必須抱怨的是,Nagios官方網站上根本就沒有提供這樣的備選說明。
Web用戶界面中包含的CGI素材在外觀與操做感覺上都與Web頁面很是類似。管理員啓動頁面左側設有基本導航與公告/訪問軟件更新、技術支持與其它實用資源等選項。進入左側的導航界面,咱們能夠訪問各種指標,包括主機、問題以及報告的整體概述與細節信息。
「戰術總結」屏幕顯示出包括主機及服務在內的整套體系的當前運行狀態。狀態摘要則經過「關鍵」、「警告」、「未知」、「待定」以及「良好」等詞彙對狀況加以歸納。網絡圖中顯示了全部主機、各自運行狀態以及彼此之間的鏈接方式。經過將光標移向不一樣主機,咱們看到更爲詳細的概要信息。若是咱們的基礎設施由數百乃至上千臺主機構成,那麼這項功能恐怕沒什麼實用價值;但在小規模基礎設施中,它倒確實可以提供實時的網絡體系說明。
Nagios應用的一大優點在於可以在節點之間快速起效。略顯平庸的用戶界面使得資源沒有被浪費在花哨的描述與表現形式上(但這也使界面較難上手)。雖然簡單的設計不能算壞事,但咱們仍然但願供應商能將界面風格加以進一步統一,同時對顯示數據進行整理以提升可讀性。固然,也許他們是故意經過這種笨拙的效果敦促用戶儘快購買商業版本。
在報告功能方面,Nagios Core提供多種預置屏幕報告方式,用戶能夠在經過選項參數設置在下拉菜單中使用臨時報告。但咱們沒法將報告內容以PDF或者其它任何格式加以導出。
單從免費版原本看,Nagios Core可謂名符其實--只提供「核心」功能組件,即最基本的基礎設施監控引擎。雖然這樣的方案在某些特定環境中也能順利起效,但咱們仍然但願花點時間進行任務管理配置。儘管Nagios Core的圖形用戶界面有些過期,但其性能表現很是出色、並且比其它全功能競爭方案更易於設置及管理。
備註:
NetXMS與OpenNMS具有很強的跨平臺能力,而Zenoss與Nagios則基於Linux環境。爲了在Linux與Windows之間找到測試環境平衡點,咱們選擇將NetXMS與OpenNMS安裝在Windows服務器當中。
原文連接:
http://www.networkworld.com/reviews/2013/070813-open-source-network-management-271449.html?page=1