前陣子有句話一直很流行,叫「知道了不少道理,卻依然過很差這一輩子」,咱們也常常拿這句話來打趣本身和身邊的運維朋友。那你有沒有想過,咱們天天學那麼多幹貨,看那麼多書,學那麼多知識,卻依然解決不了實際問題呢?php
這歸根結底,是處理問題能力的問題!python
什麼是能力? 我以爲包含了對待問題的態度,以及處理問題的思路和方法。linux
首先說態度,運維工做中咱們可能常常會遇到一些警告信息,好比偶爾的501錯誤,504錯誤等,可是,不少運維並無在乎,沒錯,是不少,僞裝看不見,不在意,或者歸咎於人品問題。 這就是態度問題。web
偶爾的錯誤視而不見,通過長時間的積累,各類錯誤就會頻發,好比本身運維的網站天天頻繁出現500,501等錯誤,此時因爲影響到正常使用了,因此不得不去處理解決,而處理的方法簡單粗暴,直接重啓服務,或者重啓服務器,因而,問題暫時獲得解決了,這種遇到問題不去深究緣由,只靠重啓解決的工做方式太多了,更有甚者,當出現問題的時候,不從自身找緣由,而是抱怨網絡狀態很差,服務器配置很差,操做系統很差,數據庫很差等等,將問題歸咎於其它外在因素,或者極度推責者,也家常便飯。數據庫
這就是態度,若是能對問題有敏感性,能對任何小的,輕微的問題有足夠的敏銳度,你就有了一個快速成長的基礎。對問題的敏銳度是很是重要的。不少性能或程序邏輯上非致命的問題,在不夠敏銳的時候是發現不了的,可是一旦進入特殊場景就會驟然爆發,你多一點敏銳度,就會減小這種危機的風險。同時,這種工做態度徹底阻止了你的成長,若是以這種態度工做,即便你有十年工做經驗,可能你僅有一年的實際能力。安全
優秀的運維人員和平庸的運維人員,不是看敲打鍵盤的速度來區分的,在遇到問題後,平庸的運維人員的解決效率,和優秀運維老鳥相比就會有天壤之別。 所謂解決效率,不外乎對故障的分析、定位,以及思考。服務器
要分析、定位問題,那麼查看日誌是個起碼的手段,你可能須要查看web server的日誌,數據庫的日誌,慢查詢日誌,binlog日誌,php的錯誤日誌等等,看似簡單不過的處理問題手段,真正可以靜心下來查看的人真的很少,線上出問題瞎猜的,壓根連日誌都不看的大有人在。看日誌不仔細不完整的也大有人在,而你能去認真研究日誌,其實已經超越不少人了。網絡
發現問題以後,天然要去解決問題,問題千差萬別,多種多樣,誰都不可能處理過全部可能發生的問題,那麼怎麼去快速解決這些問題呢,咱們說,搜索引擎是最好的處理問題輔助工具,你所遇到的錯誤信息和錯誤提示,一般95%都能在網上搜索到,固然,搜索到後要結合你的場景認真思考,並理解透徹,而不是照貓畫虎的去處理,不然可能此次運氣好就蒙對了,下次運氣很差可能就會出現誤刪庫要跑路的事情了。運維
說到這裏,好久以前遇到過一個啼笑皆非的事情,公司新入職一個運維(不知道是誰招聘進來的),某天被派到了客戶那裏處理問題,而後就QQ發信息給我,問怎麼重啓linux系統,我看到後,就回復了一句「百度一下吧」,我認爲這種問題,他確定能夠本身解決,誰知道,次日來到公司,我問他問題怎麼解決的,他說本身不太懂,沒找到關機的方法,因此就拔電源暴力關機了。我聽到這裏,默默的嘆了口氣,讓HR請他離開了。ide
爲何請他離開,由於我知道他不適合這個職位,同時即便他堅守這個職位,也不會有大的職業前景。
這是個真實的事情,沒有半點誇張成分,經過這個事情,我只是想說,要提升本身的能力,就要主動嘗試獨立解決問題,過分的依賴別人,出現任何問題都不假思索的問別人,並不能提升本身任何能力。
最後,要提升本身處理問題的能力,還要有知識的總結、梳理和概括,你今天從網上買了一套學習視頻,明天從網盤下載了40Gb的一套python課程視頻,你可能下載的時候欣喜若狂,這種方式獲取的僅僅是資料,這一堆冷冰冰的數據,除了能極大的知足你心裏想要學習的虛榮感,別的真的毫無價值。
要讓知識變熱、變成本身的,是須要動手實踐的,對一個問題,一類問題,以及不一樣類型的問題,要善於概括整理,不斷反思,儘可能把每一個遇到過的問題都記錄下來,記錄的要儘可能詳細,這樣你通過一段時間去回頭看,可能會發現不同的處理方法和思路。若是你感受到了這一點,那麼恭喜你,你的能力又提高了一步!
咱們平常遇到的問題就相似打怪升級同樣,你解決的問題越多你的能力就會越強,經驗天然也會愈來愈豐富。但人的腦殼不可能記住全部事情,將本身遇到的問題沉澱下來對之後本身查閱也有很大的幫助,就沒必要每次都要去查資料,本身也可以有一個索引庫。
常常本身總結是提升能力的最好方式。
知識的積累,不是你處理過的就必定有積累,而是整理過的纔有價值。
說了這麼多,那麼問題來了,怎麼獲取經驗和能力呢,我將多年來工做經驗進行了總結和提煉,寫成了專欄《Linux運維大牛實戰心法》,15個案例打通運維任通二脈,讓案例說話:
運維的核心競爭力是什麼
專欄目錄詳情
本專欄從系統運維、安全運維、性能調優、應用運維四個方面,經過15個具體的案例分析、概括平常運維工做中常常出現的問題,經過每一個問題出現的現象、緣由以及解決的思路,來帶領你們學習解決問題的思路和能力,經過現象看本質,根據問題的現象,結合所學的知識,一步步抽絲剝繭,找出解決問題的思路和方法,讓你們迅速提升解決問題的實戰能力。提升運維職場競爭力。
第一部分:故障排查
1.Linux系統故障問題案例彙總(沒法啓動、忘記密碼、丟失文件等)
2.偶遇"Too many open files"錯誤分析與處理實錄
3.Linux遭遇"Read-only file system"錯誤分析與處理實錄
4.不聽話的Crontab,記一次Crontab計劃任務失敗案例
5.因OpenStack物理機故障引發的Linux系統沒法啓動案例
6.Linux系統內存又被吃光了,它去哪裏了,記一次內存佔用問題調查記
第二部分:系統安全
7.回顧與總結:服務器遭受攻 擊後的處理措施
8.IDC服務器遭遇黑 客侵入後的解決方法與緣由分析案例
9.Linux後門入 侵檢測工具chkrootkit、RKHunter應用案例
10.雲服務器被植入挖礦病毒的處理與緣由分析案例
第三部分:性能調優
11.菜鳥運維初成長,記一次上線Linux服務器基礎優化案例
12.對某電商平臺動、靜態網站的優化分析案例
第四部分:運維案例
13.遠離MySQL的MyISAM,記一次MySQL數據庫故障的處理與緣由分析14.一次Java應用OutOfMemoryError故障的處理與緣由分析15.一次Java進程佔用CPU太高問題的排查方法與案例分析