對於複雜流程確認的運維自動化方案的理解與探討

前言:後端

最近開始值班了,半夜三更處理一些個小問題,本身感受是小事,可是對於邊緣節點業務線來講多是天大的事。 在想,其實這些個東西,徹底能夠作成自動化的東西。可是這個時候就出現了走流程和承擔責任的問題了 ~ 你們懂的~ 安全


其實對於快速運維方案來講,容易卡殼的地方,確定會有走流程,確認流程 ~ 其實有些時候,我們能夠下放些權利,讓普通管理員有少量控制權 ! 服務器

     我就拿下面的例子說說吧,基礎部門和業務部門分別作啥的你們確定是有了解的 ~ 當業務運維工程師鏈接不上一臺服務器的時候,會發郵件找人解決,其實發爲啥發郵件,是由於他沒有權限,他沒有這個責任,他不是基礎部門。其實這些個問題,每每是本身的程序導致cpu跑死了,或者是利用率跑滿了,致使ssh鏈接不上,可讓他們選擇重啓或者是在特殊的環境下本身鏈接到管理網處理的 ~session

      既然要這麼作,那方方面面都要想到,尤爲是權限的控制問題了~ 運維


首先須要使用kerberos用戶登陸到平臺上,後端會檢測你是否已經有改組的權限。ssh

004137830.jpg

而後輸入你要處理的服務器ip地址  (只有個別機房支持這套系統),系統會作ip的配對和字段的過濾。ide

003558398.jpg


下一步後,會根據系統裏面你的手機號碼進行驗證碼推送。spa


004413628.jpg


這時候就能夠輸入你的驗證碼了 ~設計


004311636.jpg

驗證經過後,你就能夠趕忙本身的狀況操做服務器了,須要注意的是,狀態只存在於20分鐘,20分鐘以後會清空服務器端的session對應。blog

這裏的重啓服務器,調用的是ipmitool接口,能夠實現針對硬件的操做。

若是想執行管理網的console操做的話,須要你的領導審批一個認證,你獲得一個驗證碼,也就是說 當你有手機驗證碼和審批下來的驗證碼才能夠用這個功能。  咱們也不建議他們使用。

004847774.jpg



點擊執行後,還會給技術部抄發一份你剛纔執行的過程和結果。

035029709.jpg


像這樣一個簡單又高效的平臺就產生了。這套系統安全方面我設計了兩個點,一個是他的登陸的判斷,還有就是手機驗證碼的判斷。若是想用控制檯這樣的功能,就要走一個流程了,可是也不建議他使用,對於通常人來講,這些已經夠用了

總結下:

         咱們能夠把這些個小來小去的東西,都作成一些個小系統,之後這些個功能多了,能夠集中在一個平臺上。 這些都是我們能提升效率,而不用爲一些個雞毛蒜皮的事情所打擾的好路子。

相關文章
相關標籤/搜索