摘要:
《OpenStack企業雲平臺架構與實踐》結合做者親身經歷的各種OpenStack的諮詢、規劃和實施經驗,從理論和工程角度,講述如何將OpenStack變成企業可靠的、託管企業各種生產環境的雲平臺的方方面面。本文節選自第8章。
性能監控
對於OpenStack雲平臺,主機、存儲和網絡的監控需求和傳統IT環境是同樣的,關注的主要指標包括 CPU、內存、磁盤、網絡I/O等。本文對於監控並不會展開說明,這裏展現在OpenStack部署中使用最多的一款開源軟件Ganglia。
Ganglia須要在各個節點運行客戶端程序,在中心節點部署服務器進程,來對整個集羣的性能進行監控,並提供各類視圖。另外,Ganglia服務器端進程還能夠組成集羣,提供高可靠性,用於支持大型或生產環境的監控。
圖1展現了用Ganglia來展示一個由5節點組成的機羣的Load、內存、CPU和網絡I/O的視圖,並以時間軸來顯示。另外歷史數據也被保留和查看。
圖1 Ganglia的Overview界面
圖2展現了4個節點的Load視圖,並在一個視圖中進行聚合展現。不一樣顏色標識不一樣節點的負載狀況。
圖2 Ganglia的聚合視圖和節點視圖
圖3是CPU詳細監控項目。
圖3 Ganglia的CPU監控
圖4是一個二次開發的,能夠用來監控節點運行的虛擬機的性能,本圖展現的是監控一個虛擬機的視圖。
圖4 Ganglia監控虛擬機內存
服務與資源監控
Nagios是在OpenStack部署中普遍使用的,用於監控雲平臺各類服務的開源工具,另外,它的擴展性良好,很容易加入自行開發的監控項目,爲用戶提供了很大的便利性和靈活性。
圖5展現了Nagios的鏈接視圖,這裏5個節點在同一個網絡裏。綠色表明該節點服務正常,而紅色則說明該節點至少有一個以上的告警須要處理。
圖5 Nagios的鏈接視圖
另外,Nagios能夠很容易地與郵件系統和短信平臺集成,發送告警信息。
另外,本書展現的界面只是默認的,社區裏有許多不一樣的展現界面,並且是免費的,能夠根據本身的須要和偏好進行選擇,提供不一樣的樣式和數據展示形式。但數據自己則仍是由Nagios服務提供。
圖6是Nagios的主機視圖,該節點的健康情況,以及信息收集時間等信息一目瞭然。
圖6 Nagios的主機視圖
圖7展現了Nagios的服務監控視圖。默認的Nagios能夠監控磁盤、SSH、ping等系統基本服務,可是Nagios對OpenStack卻一無所知,這是須要本身進行開發和擴展的,另外網上也有很多免費的監控腳本能夠集成進來。
圖7 Nagois的服務監控視圖
對於OpenStack服務的監控,最基本的能夠從進程角度進行監控,如進程是否運行,響應速度如何等。更好的監控,能夠結合不一樣服務的命令,經過查詢來判斷服務自己的質量如何。這須要初步瞭解各個服務的使用,以及用到租戶、用戶、密碼等信息。但若是雲平臺修改密碼,則這裏也須要進行相應的修改。
消息中間件監控
消息中間件在OpenStack雲平臺起着心臟的做用,運行不正常則整個雲平臺會運行不起來,所以監控消息中間件在OpenStack雲平臺相當重要。
圖8展現了一款免費軟件,能夠用於消息中間件統計信息的展示和一些基本管理。
圖8 RabbitMQ的Overview視圖
圖9顯示了消息中間件當前的各類鏈接,這些鏈接從不一樣節點和不一樣服務而來。
圖9 RabbitMQ的鏈接視圖
圖10展現了消息中間件的通道視圖。
圖10 RabbitMQ的通道視圖
圖11展現了消息中間件的交換(Exchange)視圖。
圖11 RabbitMQ的交換視圖
圖12展現了消息中間件的隊列視圖,幷包括了統計信息。
圖12 RabbitMQ的隊列視圖
圖13是管理員視圖,能夠修改密碼、增長用戶等。
圖13 RabbitMQ的管理員視圖
日誌分析
OpenStack雲平臺因爲服務衆多,會產生大量的日誌輸出,在雲平臺初建,涉及Debug時,日誌量巨大,對於問題的調試很是不方便,由於關聯的服務每每運行於不一樣節點之上。
LogStash在各個節點部署了代理程序,能夠將日誌輸出匯聚到中心節點進行分析。中心節點本質上是個搜索引擎和信息統計工具。
圖14展現了LogStash的Overview視圖,能夠看到整個雲平臺日誌產生的數量趨勢。
圖14 LogStash的Overview視圖
圖15展現了LogStash收集的OpenStack雲平臺的日誌信息彙總,並按時間順序顯示,並能夠按不一樣的維度進行排序、關鍵詞搜索。
圖15 LogStash的消息視圖
圖16展現了過濾後的視圖,這裏咱們只關心哪一個節點在何時發生了什麼事情。LogStash能夠很好地幫助咱們實現這些。
圖16 LogStash的消息過濾視圖
#############################
本文節選自 《OpenStack企業雲平臺架構與實踐》第8章第8節,由電子工業出版社,2014年11月出版。
做者簡介
張小斌,蘇寧北京研發中心雲計算研發部負責人,擁有15年豐富的計算機軟件設計、開發和管理經驗,主要著做有《黑客分析與防範技術》和《計算機網絡安全工具》(國內最先的網絡安全書籍)。曾在朗訊貝爾實驗室和硅谷Terawave等公司工做多年;在HP擔任解決方案架構師;在賽門鐵克任主任工程師,研發存儲備份軟件,曾參與公司全球「Cutting Edge」技術大會並作技術報告;在北電網絡、Websense、TrustGo分別擔任技術經理、研發經理和研發總監職位,曾負責郵件安全、移動安全、移動互聯網搜索引擎等的研發管理工做;在VMware和IBM的雲計算部門負責雲計算產品的架構設計和解決方案等工做。ios