linux運維人員職業發展架構規劃

層級: 搭建好---用好----服務統籌安排-----架構設計 nginx

產品成功: 抓住用戶的痛點(培訓機構好是由於大學生的實際能力差。) web

系統架構師(偏管理): 網絡 系統 數據庫 開發 雲計算 自動化 運維管理 服務管理 項目管理 測試 業務 shell

專一於某一個領域 數據庫

運維分類: apache

監控運維(7*24運維值班 故障處理) 後端

應用運維(項目上線 服務部署 業務部署 版本管理 灰度發佈) api

安全運維(總體的安全方案 規範 漏洞監測 安全防禦等) 緩存

系統運維(架構層面的分佈式緩存 分佈式文件系統 日誌收集 環境規劃【測試 開發 生產】 架構設計 性能優化) 安全

基礎服務運維(內部dns 負載均衡 系統監控 資產管理 運維平臺) 性能優化

基礎設施運維(系統初始化 網絡維護)

機房運維(負責設備的上下架 巡檢 報修 硬件監控)

運維自動標準化:

1. 運維標準化

物理設備層面:

1.服務器標籤化,設備負責人,設備採購詳情,【購買機器的時間,路徑】,設備擺放標準。

2.網絡劃分,遠程控制卡,網卡端口,

3.服務器機型,硬盤,內存統一。根據業務分類。

負載均衡佔cpu 內存,但不佔I/O。

數據庫 raid10 ssd 硬盤,cpu 內存

4.資產命令規範,編號規範,類型規範

5.監控標準

操做系統層面:

1.操做系統版本

2.系統初始化(DNS,NTP,內核參數調優)

3.基礎Agent配備(zabbix agent ,logstash agent,saltstack)

4.系統監控標準(CPU 內存 硬盤 網絡 進程)

應用服務層面:

1. web服務器選型(nginx apache)

2. 進程啓動用戶,端口監聽規範,日誌收集規範(訪問日誌,運行日誌,錯誤日誌)

3.配置管理(配置文件 腳本規範)

4.架構規範(nginx+keepalived lvs+keepalived)

5.部署規範(位置 包命名等)

運維操做層面:

1.機房巡檢流程 (週期 內容 報修流程)

2.業務部署流程 (先測試 後生產 回滾)

3.故障處理流程 (緊急處理 故障升級 重大事故處理)

4.業務上線流程 (1.項目發起2.系統安裝3.部署nginx4.域名解析5.測試6.監控7.備份)

5.業務下線流程 (誰發起下線,數據處理,機器是否回收)

6.工做日誌流程 (如何編寫工做日誌)

7.運維安全規範 (密碼複雜度 更改週期 ***使用規範 服務登陸規範)

標準化(規範化 流程化 文檔化 ) 目標:文檔化

運維自動化-工具化

1.shell 腳本【功能化流程腳本 檢查性 報表性】

2.開源工具:zabbix ELKstash saltstack cobber

目標: 1.促進標準化的實施

2.講重複操做簡單化

3.講屢次操做,流程化

4.減小人爲操做的低效和故障率

工具化和 標準化 是好基友

痛點:

1.你至少要ssh 到服務器執行,可能犯錯

2.多個腳本有執行順序的時候,可能犯錯。

3.權限很差管理,日誌無法統計

4.沒法避免手工操做

例子: 好比某天咱們要對一臺數據庫進行版本停機升級服務,那麼要求進行評估。

停機影響:3:00 晚上有定時任務鏈接數據庫,作數據統計表

運維自動化-web化

運維平臺

例子:job管理平臺

1.作成界面web

2.權限控制(好比: 數據庫的 增 刪 改 查)

3.日誌記錄

4.弱化流程

5.不用ssh到服務器,減小人爲操做的故障。web ssh

運維自動化的服務化(API化)

DNS web 管理 bind-DLZ dns-api

負載均衡web平臺 slb-api

job管理平臺 job-api

監控web平臺 zabbix zabbix-api

操做系統安裝web平臺 cobber-api

部署平臺 deploy-api

配置管理平臺 saltstack-api

    1.調用cobber-api 安裝操做系統

    2.調用saltstack-api 進行系統初始化

    3.調用dns-api 解析主機名

   4.調用zabbix-api 將新上線的機器加入到監控

   5.再次調用saltstack-api 部署軟件

   6.調用deploy-api 將當前版本的代碼部署到服務器上面

   7.調用test-api 測試當前服務運行十分正常

   8.調用slb-api 將該節點加入到集羣

自動化運維-智能化

智能化的自動化擴容,縮容,服務降級,故障自愈

虛擬化擴容

自動化擴容

觸發機制à決策系統(決策樹)

zabbix 觸發action

觸發:

1.當某個集羣的訪問量超過最大的支撐量,好比10000

1.1 cpu 內存使用率達到。。

2.並持續五分鐘

3.不是***

4.資源池是否有可用資源

        4.1當前網絡帶寬使用率

        4.2 若是是公有云---錢夠不夠

5.當先後端服務支撐量是否超過閾值。若是超過應該後端先擴容,

6.數據庫是否能夠支撐當前併發

7.當前自動化擴展隊列,是否有正在擴容的節點

8.其餘業務相關的

備註:

1先判斷buffer 是否有最近x小時,已經建立的虛擬機。

並查詢軟件版本是否和當前一致,若是一致,跳過234步驟。若是不一致,跳過23

2. openstack 建立虛擬機

3. saltstack 配置環境

4. 部署系統部署當前代碼

5. 測試服務是否可用

先啓動----而後沒反應,須要sleep 一會,而後在測試。

6.加入集羣

7.通知(短信 郵件 微信)

自動化縮容:

1.觸發條件和決策

2.從集羣中移除節點

3. 通知

4.移除的節點存放於buffer裏面

5.buffer裏面的虛擬機有效時間一天,存放於xx區,超時會自動關閉。

6.xx區的虛擬機,每7天清理刪除

ITIL --(IT基礎架構庫)-------運維經理學的

相關文章
相關標籤/搜索