PE: Production Engineer,應用運維或者業務運維。當業務發展到必定規模時,會出現專門的DBA,配置管理員,網絡工程師和安全工程師等等,這個時候的部分運維開始專一於業務,PE的概念最初來自於雅虎而後經由阿里巴巴發揚光大。PE須要關注業務的整個生命週期而不只僅是業務的運行環境,這個時候的PE須要瞭解業務,保障業務的穩定性,梳理業務鏈路,分析性能瓶頸,進行容量規劃,以及做爲開發人員和DBA,網絡工程師,配置管理員之間的協調者。同時PE須要和開發人員合做或者自主開發簡單的運維工具,主持故障恢復及問題分析。
DevOps: Development and Operations,突出重視開發人員和運維人員的溝通合做,經過自動化流程來創建流水線式的業務流程。DevOps的概念最先來自於歐洲,近幾年因爲微服務,docker等技術的成熟興起於美國互聯網公司如Google,facebook。DevOps不只僅是運維的工做,不能簡單理解爲運維開發,它其實涵蓋開發、測試和運維。DevOps既然是運維和開發的結合,就必然會出現兩個方向的融合。從運維到DevOps,須要運維人員開發自動化運維繫統實現自動部署,持續交付,自動測試,監控報警等等,將平常運維工做交由系統完成,解放生產力從而專一於將更多的運維經驗落地成DevOps自動化系統;而從開發到DevOps,則須要開發人員會熟練使用自動化運維繫統管理本身的應用的整個生命週期,實現高效交付,高可用。SRE: Site Reliable Engineer,可靠性工程師。SRE的概念是由Google提出來的,它是DevOps落地的產物。SRE不只要平常運維和工程研發,還要負責應急響應和業務規劃。一般SRE團隊成員來自於運維團隊和各業務線,他們須要熟悉所負責的整個業務架構和流程,當天值班成員能夠自行處理緊急問題。
AIOps: Algorithmic IT Operations 或者 Artificial Intelligence Operations, 智能運維。隨着大數據和AI的興起,AIOps也被提了出來。運維工做的核心概括起來就三點:發現問題,分析問題和解決問題。當自動化運維繫統落地以後,人的主要做用就是根據問題做出決策,所以AIOps就是基於人的經驗到基於機器學習的轉變,經過人工智能對大量運維數據的學習來做出準確的決策。AIOps能夠根據監控數據預測故障發生並及時定位和恢復,也能夠根據業務數據預估容量。