(1)基礎運維繫統建設的一些看法

基礎運維的一些認識

  • 運維目標價值: (參考InfoQ:互聯網運維的價值體系)html

    運維目標價值是制定運維規範,搭建運維體系,開發運維繫統的基本理念與指導方針.linux

    • 質量(高): 運維質量是指"知足用戶須要的程度".安全

      • 可用性: 可用性是衡量運維質量的最基本指標. 可用性就是連續服務時間佔總服務時間之比.
      • 性能速度: 性能速度是衡量運維質量的很重要指標.
      • 用戶滿意度: 用戶滿意度是衡量運維質量的關鍵指標.
    • 成本(低): 運維不是直接的效益部門, 但能夠經過成本控制產生效益. 成本控制精細化考驗運維團隊的技術能力和管理能力.服務器

      • 服務器角度
      • 帶寬角度
      • 人力角度
    • 效率(快): 最終檢驗運維效率的一個核心指標就是面向業務總體調度和總體交付能力. 這也是運維平臺化的最核心目標.
      • 故障: 故障發現, 故障定位, 故障處理.
      • 資源交付: 服務器, IP, CDN, 數據源等等
      • 變動: 擴容, 上線, 遷移等等
    • 安全(風險):網絡

      安全是互聯網產品的生命基線,宜早完善安全相關的制度和規範. 從系統級別、數據級別、應用級別等各個層次規避可能的風險與隱患。特別是數據的安全保護, 應該全局統籌,對數據創建分級體系.針對不一樣的分級制定不一樣的管理策略和使用策略,包含賬號密碼、日誌脫敏、數據隔離、傳輸加密、以及數據的加密備份等等.架構

  • 運維規範化(流程化):運維

    運維規範是運維做業的制度.全部運維繫統的用戶操做與流程設計必須兼容運維規範(流程). 若是某些領域尚無相關規範或操做流程, 應該聯繫運維同窗共同商榷制定.工具

    • 網絡操做規範
    • 服務器操做規範
    • 賬號管理規範
    • 項目部署規範
    • 數據源操做規範
    • 雲平臺操做規範
    • 其餘
  • 運維自動化:性能

    運維做業通過梳理與規範(流程)後變成一系列機械化的操做步驟. 藉助軟件手段(自定義腳本, 開源工具, 運維繫統)實現運維自動化. 運維自動化能夠實現"成本"與"效率"的部分目標.加密

  • 運維平臺化:

    • 運維規範化與自動化後, 能夠大大下降人力成本, 排除故障隱患, 加快資源交付效率. 可是沒法對資源進行綜合管理,也沒有總體調度/總體支付的能力, 更別說容量規劃,成本審計,資源統籌...等等.

    • 現代"雲"只是運維平臺化的一種實踐與方向!資源通過虛擬化與服務化後整合到雲平臺集中管理, 提升了總體調度與快速交付的能力, 也節省了人力運維的成本. 雲平臺一面"便利", 另外一面"炙手":

      • 資源隔離成本變高: 不一樣VPC的資源藉助VxLAN隔離, 同一HV的靜態資源使用linux用戶目錄權限隔離, 動態資源使用cgroup,namespace等隔離, 公共集羣的資源基本沒法隔離. 這些都會直接損耗物理設備的一些性能.
      • "類DoS"故障機率加大: 公共集羣可以實現"綜合成本"目標, 卻須要十分當心預防"類DoS"故障, 這就迫切要求雲架構中融入"保險絲"的熔斷技巧, 避免某個項目或某個用戶在某個時刻對集羣太高的佔用率癱瘓了其餘項目或用戶的正常業務.
      • 安全難度係數加深: 平臺的每一個環節均可能引入安全"風險". "短板效應"更加深入!

後話

運維繫統建設必定是運維同窗與研發同窗共同合做的成果. 運維同窗直接服務用戶, 最清楚系統的需求. 研發同窗在設計流程或者開發系統的時候, 與運維共同梳理需求, 抽象操做流程. 而後通過:

  1. 規範化(流程化): 約定操做中涉及的步驟,目錄,權限,依賴等.
  2. 自動化/平臺化: 基於規範後的結果設計用戶頁面,實現功能模塊.

這樣開發出來的系統纔會不偏離需求, 才能更好地協助運維同窗實現運維的目標價值.

參考

相關文章
相關標籤/搜索