僅以此係列獻給那朵菊花。html
隨着各類業務對IT的依賴漸重,企業的IT基礎架構規模不斷擴張。做爲一名系統工程師咱們將如何應對這種日益增加的IT架構呢?在之前系統管理員就像流水線上的一名工人,不斷重複的作着一樣的工做;如今這一切即將改變,咱們將引入一批工具,這批工具是「可編程」的,你只須要爲這批工具寫上幾行「代碼」,它便會幫你自動完成全部的工做。而這批工具就是咱們研究的對象,以後的一系列文章我將詳細介紹這些工具。我慢慢寫,你慢慢看。ios
系統工程師可利用的自動化運維工具能夠分爲三大類:預備、配置管理和監控。
在早期,Linux管理員可能會整理出一個軟件包列表,經過rpm進行批量軟件安裝。後來,咱們用Kickstart來執行無人值守的Linux安裝。如今,Cobbler把這個功能提高到了一個新的高度:它實現了物理機與虛擬機的並行系統構建,而且能夠進行DHCP和DNS的配置。Cobbler還集成了其它的工具,好比用於配置管理自動化的Puppet等軟件。這個工具能夠在系統安裝完畢後進行服務的自動更新。
配置管理工具用來設置參數或者開啓一個新服務器上的服務。配置管理能夠用於服務器自動構建。服務器自動構建工具能夠加速部署速度,並能夠在短期內大規模部署服務器,同時也可讓構建過程更容易複製。在發生嚴重故障時,還能夠重建架構。
上述大部分工具都是實時的,能夠用來進行變更並執行某些任務。然而,它們卻缺少關於當前系統情況的信息,因而監控工具就有了用武之地。對於傳統的系統管理員而言,監控無非是在發生錯誤的時候經過一個頁面或者一封郵件提醒他們。可是,監控工具--好比Nagios、OpenNMS和Zenoss Core--可以提供更爲完善的服務器性能檢測。這些信息告訴管理員們有關運行中的應用正處在怎樣的狀態下。它們中的一些甚至能夠調用配置管理工具進行自修復。例如,Zenoss Core能夠在一個檢測狀態臺上經過Cfengine、Chef或者Puppet來從新配置服務。
在DevOps GameDay上演示了一個自動故障檢測和故障修復的場景。一個同時託管於東部和西部海岸的亞馬遜EC2數據中心的網絡應用程序。在西海岸的管理員製造了一些服務器故障,Zenoss Core對架構進行了監測,發現了故障而且通知OpsCode的Chef採起行動。Chef隨後經過Dynect API更新了Dynect平臺上的服務,從而自動恢復了東海岸的應用。
就像在DevOps GameDay上演示的那樣,若是整個IT架構是自維護的,系統工程師不再用晚上爬起來處理故障了,哪將是多麼美好的事。web