系統運維祕訣大分享專題
本專題整合收錄了有關係統運維
本文是
如下爲正文。
在運維管理的過程當中,我發現了不少有價值的祕訣,本文是這些祕訣的一個總結。雖然這些祕訣可能比較「惟心」,可是我仍是把它們總結出來了,相信它們會對你有幫助的。
Dormando
下面先從技術篇開始。交流篇和實踐篇會陸續整理放出。
Google
每一件事情都是在尋找平衡點。你也許會認爲把你的系統和某個操做系統或某個
這並不意味着你的系統必須是平臺無關的。其實咱們的目的很簡單:一變二,二變二十,一個系統必須能夠應對各類突發事件。也就是說,若是一個系統管理員被公共汽車撞了,你有應對的方案!若是掛載的硬盤出現故障了,你有應對的方案!若是某些人運行了
不要手動構建任何東西。若是你必定須要手動構建,那麼就作兩遍,在作第二遍的時候把用到全部的命令都提取出來。
下面這一點十分重要:將新硬件上線到生產環境的過程不該該超過
下面這一條是普世真理:這個世界上不存在「一次性」的服務器構建。即便你的服務器只須要構建一次,但只要你構建過一次,就必定會有第二次。好比,當它損壞的時候,或者你必須進行一次重大的升級才能讓它在在接下來的兩年時間裏更加穩定的時候。
測試,檢查新構建好的服務器。這應該是比較容易的,由於你的構建過程都是自動化的,對吧!
腳本化的構建,意味着從某個
V4
,對腳本進行測試。若是有問題,參考文檔並修復它,直到它能夠再次正常工做。這最多應該是一個星期的工做,而不是一個長達一年的浩大工程(由於那時,剛剛完成的
容易從新構建,並不意味着你能夠忽視冗餘。跳轉盒,郵件服務器,計費網關,等等。若是其中的一半掛掉了卻並不形成客戶的宕機,生活將會變得更加簡單。
按照以上方針來作的話,當某個設備在凌晨
下面這一條是個聊勝於無的解決方案:
備份是個嚴肅的話題。使用硬盤,燒錄磁帶。壓縮它們,移動它們,並行地運行。對每同樣東西進行備份!
若是你的構建過程是自動的,整個過程均可以被備份。若是到目前爲止的幾條你都作到了,那麼一個真正的「災難恢復」計劃也許並非那麼高不可攀的。
監控你能監控的全部東西,並且要用正確的方法來進行監控。若是你的
若是你有
圖形的做用是讓趨勢可視化。歷史數據的做用是讓你對數據進行精確的分析。不要把這二者混爲一談!對圖形進行目測,很容易得到錯誤的數值。許多站點都使用
若是你要瀏覽數百張圖才能精確地對一個問題進行定位,那真是糟透了。想要找出極值?請使用腳本提取數據。
若是你必須使用圖形來解決問題,儘可能把各類高級的概念整合到一個單一的頁面中,而後讓這個頁面連接到擁有具體信息的子頁面中。若是你在數據庫負載中能夠看到一個峯值,你能夠點擊這個頁面對那些數據庫進行概覽,而後找到那一兩臺可疑的機器。基本的理念是儘快地縮小範圍,儘量的減小猜想。
不管是獨立工做仍是與開發部門合做,都要把儘量多的有用的信息記錄到日誌中。不管是分析以後再保存,仍是直接扔進數據庫中生成報告,這些都無所謂。信息終歸是有用的。
有用的例子:頁面呈現時間(哪一個頁面?哪一個設備?),面向用戶的錯誤,數據庫和內部服務錯誤,帶寬使用率等。
創建圖表,報告,並對產生的歷史數據進行比較。
報告是十分重要的。每週或天天對你的基礎設施變動進行彙總。
誠然,數據庫運維是一套完整而獨立的知識體系。可是有時,你不能把一切都丟給你的
擁有多個冗餘的數據庫會給你帶來不少好處。對於一個龐大的
和
數據庫配置一直在改變。如今出現了
善用你的過濾器!若是這些數據很重要,應該對它們進行備份!單片的
能夠慮一下替代的解決方案。
橫向擴展是咱們應該走的路。應該使用常規的(即:可用的,價格適中的,標準的。而不是特便宜的!)硬件,而後和你們一塊兒努力,確保各方面均可以進行橫向擴展。
橫向擴展從兩臺機子開始。另外,進行冗餘的時候也會涉及到橫向擴展。
儘量的橫向擴展,可是不要傻乎乎的擴展。在
留意一下替代的解決方案。按照用戶或區域對多個數據庫進行劃分,同時避免增長過多的
一切均可能擴展!路由器,交換機,負載均衡器,
記得縱向擴展嗎?之前那些邪惡的大型機們有不少核,不少
RAM
將以上兩點合併起來,這意味着你只須要再次合併服務就能夠了。這兒有一個負載均衡器,那兒有一個
做業系統(
對於開發者和系統運維人員來講,緩存但是個好東西,值得大力發展!的確,它是難以想象的。它是不同凡響的。有時你可能必需要爲它作一個權衡。有效地使用緩存能夠讓系統的總體性能提高
Memcached
測試它,玩弄它,並打破它。使用緩存會帶來新的問題。要作好準備。
能夠使用
維護這些東西是一個運維人員的問題。使用它們既是開發者的問題也是運維人員的問題。
當用戶點擊「給我全部的朋友發送郵件」的時候,把這個工做列入計劃,而後立刻說:「
做業系統是銜接各個服務的一個場所。博客投遞
容易擴展。在請求進入的地方會有一些瓶頸,全部的工做線程必需要作的事情就是「拉」。這個是相對於
必定要安裝安全更新!這十分重要!有不少瘋狂的網絡專家致力於在儘量短的時間內給你提供這些更新。不要由於你懼怕改變而讓他們白白地付出勞動。
安全性也是分層的。明白你能確保什麼,以及不能作什麼。
在
搞清楚你的應用程序是如何工做的,它具體須要作些什麼,並相應的進行調整。好比說,若是你的應用當中,只有付費頁面和
對於
除了這些具體的建議以外,你還應該多讀一些資料。本身判斷,本身動手測試。若是你不知道一個安全模型是如何工做的,一時半會兒可能問題不大,可是這就會致使你不知道它的限制在哪裏,甚至於沒法判斷它是否在工做。
基於測試,理論,攻擊樹的安全機制是不會在背後給你一刀的。當人們構想出模糊的安全模型的時候我也很喜歡它,可是像我這樣的普通人均可以把它弄的支離破碎。
儘量地進行巡查!登陸,退出,以及使用的命令都要進行審查。對面向外部服務的全部訪問,包括全部在請求中指定的參數,都要進行審查。對於你的應用程序來講,找出極值,而後完全禁止輸入超出範圍的值。作你能作的全部事情,讓數據以可追溯的方式工做。
若是你懷疑某些東西可能會被破壞,應該採起適當的預防措施,最好懂得一點計算機取證方面的知識(或者聘請一個專門從事這項業務的公司)。經過移除可疑的網絡訪問來作出響應,經過一系列的控制檯或直接經過終端來檢查整個系統。在已經被破壞的機器上,避免使用任何的服務,配置文件,或數據。不少人都是「清除了一個木馬」,可是不知道它是怎麼進來的——這樣並不算真正地清除了這個木馬。
若是你有安全團隊,取證專家,或其餘人手,那麼你儘可能不要接觸那臺機器,把它隔離起來。這意味着不要從新啓動它來「清除一些奇怪的進程」。他們須要這些證據。若是你必須這麼作,就去作吧,可是要記得把系統完全地清理乾淨,打上全部的安全更新,儘可能搞清楚他們是否已經破壞了重要的數據。作你能作的全部事情。
安全其實是一種權衡。若是你作錯了,開發者和用戶們都會「揭竿而起」:他們會找到一些方法來繞過安全機制。若是他們能夠繞過它,那說明你的工做並無作好。若是他們不能繞過它,那麼他們也許會放棄,而後離開。
緊抓訪問控制。這意味着運維人員必需要爲已經鎖上門的「房間」提供一些窗戶。不讓開發人員進入生產環境,意味着他們必須抹黑解決難題。你的確不能讓開發者們直接對服務進行修改,可是你能夠提供日誌工具和調試工具等等。對於各類產品來講,這些都是成功的祕訣。
【
原文:
在以前咱們已經介紹過了
交流篇
訂閱一些
閱讀「達人」的博文。有時他們會投遞一些有趣的主題,而且咱們還能夠經過評論直接和博主進行交流。
閱讀幾篇非「達人」的博文。經過他們遇到的問題,或者他們作了但沒有作好的工做,咱們能夠找到一些感受。(譯註:這一點我我的深有體會。閱讀一些新手的博文,咱們經常能夠獲得啓發,由於咱們的一些作法雖然不會出問題,可是太程式化了,天天都重複一樣的事情,咱們沒法進步,而新手因爲缺少經驗,他們會不斷地嘗試各類作法,他們遇到的問題極可能是咱們沒有遇到過的,這對咱們來講是一筆財富。)
想盡辦法認識一些能夠「痛扁」你的人。注意,必定要謙虛。
經過多種來源學習。經過多種方式吸取知識有助於找到最適合你的方式。
仔細研讀其餘公司成功或失敗方面的故事。能夠嘗試打電話給他們的
若是你不斷地進行嘗試,你會發現你能作的事情遠遠超出了你的想象。之前歷來沒有見到過?那就試試看。
儘可能不作一隻危險的「菜鳥」。在你有把握不會把整個房間都燒掉之前,應該在「沙箱」中進行嘗試。
真正地搞清楚冗餘會對哪些事情形成怎樣的影響。在什麼狀況下它能夠發揮做用,在什麼狀況下它沒法發揮做用。
嘗試破壞你的系統。你能夠在測試實驗室中嘗試,有時也能夠在生產系統中這樣作。瞭解一下當你處於受限狀態中的時候能夠作什麼。好比,拔掉電源,抽出網卡,殺死進程,拔掉幾根內存,抽掉硬盤,拔掉網線。
在冗餘存在的狀況下嘗試替換和升級系統。
關於如何開發出可擴展的系統,有不少的資料能夠參考。雖然你不用本身編寫一個這樣的系統,可是你要儘可能搞清楚這方面的理論知識。
學習虛擬化。建立幾個虛擬機,而後嘗試着擺弄一下針對多臺機器的應用程序。在本地的不一樣的端口上運行多個實例。
一般,運維人員要作一些系統承載量方面的計劃。若是你不清楚應該把什麼資源應該添加到哪裏,你就不會知道應該添加些什麼。
問題突然發生,而時間是寶貴的。你必需要有本身的知識儲備,並高效的使用它們。
常常練習着解決問題。挑選出一個能夠正常工做的完美頁面,而後試着跟蹤一下它是如何工做的。
strace, ltrace, lsof,logs
搞清楚
熟悉
記錄文檔。
構建更多的工具。不僅是爲了你本身,也是爲了其餘人。你也能夠給現有的工具添加一些功能。
信不信由你,運維人員和
運維人員必需要爲服務器維護高帶寬的網絡訪問。
彼此的分工要明確。
不要疏遠他人。
儘量的讓你們以爲
大家都爲同一個產品工做,大家的目的也是一致的。試着多配合一下。
一塊兒開策略會議並不等於在一塊兒工做。
開發人員更瞭解代碼資源,運維人員更瞭解硬件和部署。把這一切都記在內心,你能夠讓一些事情變得更高效。
交叉培訓。傳播雙方使用和設計工具的心得,這能夠提升工具的可管理性和靈活性。
注意不要過多地要求對方。這不是「咱們」
若是你們相處的很融洽,就能夠從容地應對各類緊急事件了。
每一個領域的運維都有他們本身的專長。網絡,數據庫,
一味地墨守陳規是消極的,使人厭煩的。讓你的運維們重複的作相同的工做能夠很快的增長他們的流失率。要尊重系統運維們在網絡運維們的背後觀察學習的機會。
時刻記得給人們嘗試,學習和成長的機會。
注意別給你最優秀的運維安排了太多的活兒。你想要用的運維是那種有能力給本身找出空閒時間的人。
渾水摸魚者(編者注:原文爲
【
原文:
若是一個
在一週中,專門挑出一天來「清理門戶」。更換掉全部存在故障的硬件。在歡度週末以前,確保一切都是完整無缺的。
若是使人討厭的小問題忽然發生了,在早上要作的第一件事情就是永久性的修復它們。日誌塞滿磁盤的狀況在上週發生了兩次?明天再說吧!若是老是這樣,這些問題會堆積起來……
若是你的構建過程是自動化的,充分利用這個優點來修復一些你能夠立刻修復的問題,或許也能夠批量進行修復。
人們沒法(輕易地)搞亂腳本化的任務。
從第二次開始自動化。若是第一次你必須手工來作一件事情,那麼把你作的事情寫入一個腳本。
帶註釋的腳本是絕佳的文檔。與其把如何安裝一些東西的方法詳細地寫到長達
腳本能夠被放到自動化的構建過程當中。若是要更接近這個目標,應該把一些常常作的事情都應該變成「零時間」的任務。
只作小規模的,獨立的變動。
若是不是必須改變,那麼就保持原樣。
這也意味着你必須搞清楚何時才應該進行變動。找出什麼東西是必需要進行變動的,而後對它進行升級,把它拿出來,讓它標準化。
這裏的
若是快速解決問題比較困難,那麼你能夠學習一些基礎知識,作出一張清晰的升級路線圖。雖然你的新郵件系統也許並非你夢想中的、帶有強大反垃圾郵件功能的巨大系統;可是架設兩臺配置乾淨的
你們都傾向於把未完成的項目放在那裏置之不理。這是你要避免的。
通常來講,運維工做就是要讓代碼更好地運行。並行化,創建起回滾重啓機制。
運行內容包括軟件更新,安全補丁,配置變動。
使用
文件數量越少越好。若是隻是爲了推出一個新的數據庫就要在
OS
堅持按照這些規範來行事。對一些方法進行調整和改進,讓它變得更有意義。
永遠沒關係抓着主版本不放。若是你的產品功能尚未永久性地凍結,你就必需要按照規範繼續向前推動,把過去的一些事情都拋在腦後。
按照規範來作的事情越多,你的工具能夠發揮做用的場合就會越多。用於支持其餘運維領域的軟件包越多,能夠適應的場景也越多。
把流程文檔化
把產品文檔化
不要讓文檔出現冗餘。若是一個腳本的幫助文檔很長,能夠進行引用。好的文檔是一個持續改進的過程,它要一直保持準確。
把文檔和代碼,
過時的文檔是有害的。留出一些時間來更新它們。當新的員工遇到問題的時候,和新的員工坐下來一塊兒更新文檔。
適當地使用問題跟蹤系統(
使用
把配置文件、腳本等各類東西都放到源代碼控制工具中管理起來。
爲代碼遷出提供各類入口。
保持遷出的嚴謹性,精準性和可控制性。禁止提交沒法進行審覈的變動。應該提交的變動應該是不用源代碼控制工具也能容易地進行測試的(在虛擬機環境下,能夠直接在一個單獨的測試機器上進行測試)。
區分出執拗的人和精明的人
不要避免聘請「老前輩」。某個領域的「老前輩」可能已經跟不上技術變革的腳步,以致於你可能不想聘請他們。可是,老是要有幾個「超級巨星」來壓住陣腳的。
不要避免聘請新手。我認識的不少人都是從一個真正的新手開始的(包括我本身!實際上,我認爲我本身一直是一個新手)。通過這個階段之後,他們會迅速地成長起來。如今正是確立職業生涯的時候。我相信咱們中的絕大多數人都是這樣的。固然,不包括那些不學習的人,沒有積極性的人,或者入錯行的人。
購買專有硬件的主要劣勢是提供商鎖入,你不得不老是使用這個提供商的產品。這多是一個特殊的
若是全部東西都很深奧,都很不明朗,都尚未通過文檔化,而且直接依賴於專有的負載均衡器……那麼最好別用,由於用了你就不自由。
對你最終選擇的提供商好一點。若是你每一次採購都在價格方面把他們逼到牆角,那麼你只能獲得一些垃圾硬件了。
有時候數據中心有不少潛在的可用資源。儘可能把一些免費的遠程協助服務寫到合同裏,好比就更換硬盤驅動器,提供商的出貨
nginx
「一分錢一分貨」這種思想是一個完全的謊話。若是你沒法讓開源軟件爲你工做,須要協助,你能夠找一個提供商。若是你的團隊既睿智又積極主動,這些小夥子們想要搞清楚他們的基礎設施是如何工做的,那麼你必定沒法抵擋來自於
MySQL
關於
【
原文:
最近一篇關於優秀的
《
咱們不須要臭名昭著的編輯器。腳本就很好,咱們欽佩那些精通
推薦專題:
Vista
服務器技術頗有魅力,並且回報也很大,可是,工做站上的管理服務水平真的很重要。當
相對於其餘系統的管理員來講,咱們不會爲了編寫特定得腳本而給咱們的系統增長潛在的安全漏洞,即便這會影響重複性的,手工任務,咱們也在所不惜。取而代之的是,咱們會假設某些人在某些地方遇到了一樣的問題。咱們會跳到最近的瀏覽器會話上,而後搜索一個通過全面測試的解決方案(其餘人已經使用過這個解決方案了)。
咱們儘可能不去當「炮灰」。咱們依賴於世界上最大的軟件公司來檢查咱們部署的產品,通過時間驗證的解決方案一般會賽過那些最新的,最偉大的解決方案。當一個用戶有一些很酷的東西要嘗試的時候,咱們會把他們轉到一個獨立的子網或
咱們能夠像下一代極客同樣極客,也能夠像下一代極客同樣創造出比「
雖然咱們也涉獵過
像其餘人同樣,咱們也能夠憑藉咱們在服務器和網絡產品方面的專業知識而趾高氣揚,可是在專家的世界中,咱們只是一些小角色。若是咱們是
不管咱們是不是
這是事實。有時咱們不得不重啓
編者按:優秀的
就像「
實際上,對於那些強制全部用戶都要使用
雖然咱們知道,對於許多
雖然我只能萬般無奈地認可
編輯推薦:
對於正則表達式的排斥,甚至是漠視彷佛都是「邪惡」的鍵盤形成的惡果。可是,對於咱們來講,它是如詩般優雅的。它的強大表如今,任何其餘的著名工具都沒法和
編輯推薦:
當遇到一個看起來須要不少手工的,重複性的工做才能解決的問題的時候,咱們這些守舊派的
編輯推薦:
若是有好幾種方法能夠修復一個問題或者實現一個目標,那麼咱們會選擇花費更多的時間來開發一個既能夠解決當前的問題又能防止未來發生相似的問題的解決方案,而不是簡單地貼上一塊邦迪牌創可貼。這是由於咱們討厭再次遇到那些在咱們的印象中已經解決過的問題。咱們認爲,若是咱們能夠提早多考慮幾步,防止未來發生相似的問題,那麼在未來,咱們能夠節省更多的精力。一般咱們都是對的。
enlightenment
當處理一個大問題的時候,咱們在「屍檢」上花費的時間要比咱們解決這個問題所花費的時間多得多。若是不是工做壓力太大,讓咱們無暇分身去研究這個問題,那麼咱們必定會搞清楚這個問題的確切緣由的。
對於咱們來講,經過
編輯推薦:
雖然在咱們本身的機器上,咱們可能並不運行
Unix
從「謊話」的角度來看,這些品質中的某些品質看起來會有點另類或者難以理解,那是由於他們原本就是如此的。其餘人只能看到棘手和困難的時候,咱們卻看到啓示,學習,經驗,更重要的是,咱們看到了邏輯。
【
原文:
系統管理員們踏上崗位,都已經具有了一些有關係統和服務的知識,如如何搭建生產環境,如何備份,如何監控系統等等,這些知識可能來自學校,可能來自自學。然而在工做了數年以後,系統管理員們對生產環境中的操做又會有了不少新的瞭解。下面,資深運維專家
在複雜的數據中心基礎設施中,這種能力能夠讓你經過豐富的經驗和自身的知識快速而準確地發現問題之所在。這種能力只可意會,不可言傳。沒有人會提供和「超天然故障排除」有關的認證的。
可是,那些重量級的問題解決專家都會遵照一些通用的,不成文的規則。這是我本身使用的六個規則。注意,它們適用於大多數狀況,可是並非全部狀況。
雖然這聽上去很簡單,可是,使人吃驚的是,人們常常會修改他們用於鏈接到某個設備的網絡接口的屬性,這種行爲的失敗率很高。有時,這條規則多是可選的,可是,若是有一種方法能夠排除潛在的隱患,何樂而不爲呢?若是你不得不修改這個接口,能夠在這個接口上配置一個輔助
不管什麼時候,只要有可能的話,都要提供一種能夠把問題恢復到原始狀態的方法。這意味着,在對故障磁盤作任何修改之前,應該爲這個故障磁盤作一個映像,備份整個目錄結構(你不可能知道你之後須要哪些文件,這樣能夠以防萬一),或者,在你胡亂擺弄一個已經出現故障的操做系統之前,應該在物理服務器上抽取出這塊磁盤的
在全部這些規則中,這條規則也許是你們最少遵照的規則了。毫無疑問,應該把一個問題和解決方法文檔化。當你處在混亂狀態之中的時候,你的解決方法也許並不明智。這就是說,當一個問題塵埃落定之後,要保留一份「屍檢報告」,經過這份報告,你能夠從新檢查當時那個解決方案採起的步驟和途徑。把它寫下來,而後把它保存在安全的地方,最好是放到公司內部的
推薦閱讀:
就像
推薦閱讀:
這條規則只適用於
在必要的時候,若是想恢復到過去那個良好的狀態,只須要簡單地把文件拷貝回去,而後重啓那個服務就能夠了。由於註冊表的存在和
一點點預防工做就能夠省去一個月的週末加班時間。你應該對你的數據中心的方方面面進行監控,從房間的溫度,機架,和服務器,到服務器進程檢查,正常運行時間檢查
若是在一個數據庫因爲分區過滿而被破壞的一個小時之前,能收到一個
推薦專題:
這些規則不只僅是須要遵照的規則——在你平常的工做中,這些規則應該是貫徹始終的。在
【
原文:
Linux
51CTO推薦專題:
咱們經常會看到這樣的問題:面對
一個開始系統管理員學習的方法是抓起一本相關主題的書來看(編輯推薦:
使用一個新的平臺時,有一點很是重要:你必須真正地投入進去。對此,有一個簡單的方法:看看你如今正在作的事情,不管使用哪一個平臺,試着在這臺
我一直都認爲,
我最初接觸
最後,編程和實際寫代碼的能力也是有益的。不要相信那種處處流傳的說法:管理員無需寫代碼。和周圍優秀的系統管理員聊聊(有不少這樣的人),
原文:
其餘相關推薦:
Linux
今天,
很不幸,容易入門反而掩蓋了須要作的維護工做,這些工做是保持系統穩定和使系統長期處於一個良好的工做次序中所必需的。一個單一的服務器一般能夠在沒有人工干預的狀況下運行很長時間。可是前提是全部其餘的位和塊必需被提早配置。
關於這個列表,最糟糕的事情是你可能已經幾個月或幾年沒有作這些事情了。你忽略這些事情中的任何一件,它們都會在最糟糕的時候回來做祟:好比流量高峯期,硬盤驅動器崩潰,或黑客攻擊的時候。
我用配置管理來開始,是由於它和這個列表中的其他項有很大的不一樣。這一項對單一的服務器並不重要,可是若是你有許多系統,這一項就相當重要了。
配置管理是作了,可是,卻給服務器安裝程序添加了必定的初始化複雜性,因此若是你膽子小,不用也罷。不過,即便只有兩個或三個服務器,好處也是至關巨大的。
這一項是顯而易見的,大多數的系統管理員都會在這方面作點工做的。若是你沒有一個可靠的備份策略,你如今須要立刻調整它。哪怕只等一天,後果極可能就是是災難性的。同時請確保你正確的作了備份,由於備份很容易作錯。
◆按期運行
◆保持多輪的備份
◆自動的刪除舊的備份
◆在你的如今的操做系統之外存儲備份
◆保持和你的原始數據同樣的安全性
◆合併全部的關鍵數據,關鍵的配置文件(更換服務器之後啓動和運行系統可能會須要的任何東西),和最近的日誌
緊跟着備份計劃的是測試它。這意味着按期檢查備份是否一直在作,產生的文件是不是有效的而且是否沒有被損壞,以及他們是否包括你須要的全部數據。一個好的經驗法則是若是你的備份每
51CTO推薦專題:
在最近幾年,
51CTO推薦閱讀:
跟蹤
對你的網站來講,讓你的
51CTO推薦專題:
Hardening
在一個基於
這個列表中的全部項都是最低限度須要完成的。它們很容易被忘記,直到你的系統已經被入侵爲止,你可能都不會想起它們。對異常活動,黑客攻擊和其餘惡意行爲的持續掃描,對於幫助阻止或減輕攻擊來講,是十分重要的。
51CTO推薦閱讀:
總結
這固然不是一個完整的列表,可是它也是十分普遍的,許多開發者和系統管理員只是沒有時間、興趣或知識來處理它們。更糟糕的是,許多開發項目被移交給了客戶,而一旦技術團隊遷移到另外一個項目上,這些客戶就沒有能處理這些事情的職員了。
原文:
(
【
【編輯推薦】
網站安全問題能夠說是如今最引人關注的問題。本文介紹了十條措施維護網站安全最低限度須要作到的事情,主要是給你們提供思路,爲廣大運維人員提供參考。這十條措施涉及到用戶身份驗證、數據加密傳輸、子網劃分、災難備份等多個方面的內容。
網站安全問題能夠說是如今最引人關注的問題,有關服務器安全、用戶隱私安全、企業數據安全的文章和爭論歷來沒有停息過。系統管理員做爲網站安全的第一道哨崗,既要確保網站服務器系統的安全,也要考慮到網站應用的一些基本安全防禦。
在以前《
做者簡介:
網站前端防禦
通常能夠採用用戶名
對於重要的網站應用,須要根據
有關身份認證的具體操做,編輯推薦讀者們關注
對於使用
如何創建
系統服務器側應根據帳號,對用戶的使用行爲進行詳細的日誌記錄和審計,經過上述因素的日誌記錄,進行階段性的審計(時間間隔應該比較小),從而作到發現用戶帳號的盜用、惡意使用等問題,儘早進行處理。
系統服務器側應部署
相關閱讀:
51CTO
系統的服務器端,尤爲是數據庫服務器端,應該經過配置和增長對用戶很是長應用請求的過濾和處理模塊,以免因爲數據庫的自身漏洞未及時打上補丁而遭受目前流行的
網站服務器側
系統服務器側包括大量的服務器類型,包括數據庫服務器、
參考閱讀:
系統面臨着巨大的服務量,服務器端的設備基本上都須要有多臺服務器進行業務分擔,這樣才能提升性能,避免處理瓶頸的出現,所以,須要採用合理的負載均衡和負載保護機制:
◆對各服務器的業務流量進行有效地分擔,可按照
◆負載保護機制須要實時地對每臺服務器的
負載均衡相關推薦閱讀:
任何系統都不能說
選擇合適的備份策略,作好提早備份,包括全備份、差分備份、增量備份等等
選擇合適的備份介質,包括磁帶、光盤、
選擇合適的備份地點,包括本地備份、遠程備份等等
選擇合適的備份技術,包括
做好備份的後期維護和安全審計跟蹤
Linux
系統功能複雜,業務數據敏感,保密級別比較高,而且對不一樣管理人員的權限、角色要求都不盡相同,爲了保證安全管理,避免內部管理中出現安全問題,建議做以下要求:
嚴格劃分管理人員的角色及其對應的權限,避免一權獨攬,引發安全隱患;
做好服務器機房的物理條件管理,避免電子泄露、避免因爲靜電等引發的故障;
應做好服務器管理員的賬號
做好服務器的端口最小化管理,避免內部人員掃描得出服務器的沒必要要的開放端口及其漏洞,實行內部攻擊;
做好服務器系統軟件、應用軟件的日誌管理和補丁管理工做,便於審計和避免因爲安全漏洞而遭受到內部人員的攻擊;
根據業務和數據的機密等級需求,嚴格劃分服務器的安全域,避免信息泄露。
採用漏洞掃描和挖掘設備,對內網各服務器進行階段性的掃描,並根據掃描所得的風險和漏洞進行及時地修補,以實現該漏洞爲黑客使用以前進行自行修復的目的。
這方面的工具服務不少,好比
上面這十條,並非作了就可以保證網站安全,而是要「作好」,必須作好。正在閱讀這篇文章的運維人員們,上面這些,你都作到了嗎?
【編輯推薦】
運維工程師到底都在作什麼?要回答這個問題,固然是有經驗的運維本身來講最爲真實。運維到底須要作哪些工做?網絡,系統,安全,存儲,測試,研發……全都要會!說運維是神仙都不過度。本文做者在撰寫此文時已經有了
做者前言:看到
《談網站或其餘服務器運維》,這裏只談運維工程師所要作的細節工做,
如下是我的觀點,我說的只是我本身的想法,也是我發展的目標。你能夠有異議,咱們是來交流的。你對的我確定會向你學習。由於我也在摸索。運維工程師至少要能作如下的工做:
1,網絡工程師的工做
你至少要能配置
2,系統工程師的工做
你至少要理解各類系統服務,在出問題的狀況下要迅速解決問題,而不是等系統工程師來解決。
3,安全工程師的工做
我不要求你必定要會各類網絡編程,可是在服務器收攻擊的狀況下,沒有防火牆的狀況下,作一些簡單的處理工做。
4,存儲工程師的工做
至少要熟悉各個廠商的設備,各類備份和還原的辦法
5,測試工程師的工做
在新版本上線以前,你至少要協同測試工程師作測試工做,由於你是運維人員,不瞭解程序架構致使沒法解決故障,你也有一份責任。
6,研發人員的工做
運維工具都須要自已開發,熟悉開發語言,須要有過實際開發經驗,不然工做會很是痛苦,我深有體會。
7,英語
不想說了,個人最大痛苦就在這裏
8,好的溝通者
不出問題時候你能夠打遊戲睡覺,出問題的時候要能和項目人員溝通,快速解決問題,而不是推;我知道有不少人能推責任,你能夠作替死鬼,可是離開這個工做你還能找到更好的;把責任推到別人身上的人,下次出問題的時候,絕對沒人幫你。你要能和各個兄弟部門關係很是的密切,出了問題有兄弟幫你擔責任;也要能很是扯皮,沒事在會議上把別人都搞定。
9,庫房管理員
數萬臺服務器讓你來管理,任何丟失或者損壞都是不負責任和失職的表現。
10,運動員
不要回家就睡覺,有空仍是運動下吧;在服務器
11,責任心
這個我不想說什麼,這是你的職業精神。
12,組織者
給你
13,1
你們看了確定以爲這我的是神仙,可是這必須是你慢慢能作到的,至少是我
由於如今的公司都在用招聘民工的錢招聘神仙,其次我也是想讓各位看看,運維工程師要擔負多少責任。
我去面試過的一些公司都說,你什麼都會,什麼都不精。我說對,正是須要咱們這些什麼都會的人領導什麼都精的人。
我這句話沒有貶低大牛的任何意思,只是當時一個臨場的發揮。雖說完就知道這個面試白來了,可是我仍是想爲廣大的運維工程師出口氣。
不怕千招會,就怕一招精。這仍舊是我給你們的建議。
最後給你們最後最大最重要的建議,作什麼工做均可以,千萬別作
我把
你能夠作研發,出了問題能夠測試,能夠想辦法慢慢解決;你能夠作
這就是你們羨慕的
我公司是每個月發
有的東西是企業機密,我不能透露也不能給你相關文檔。
如今你要作的,就是設計你的服務器架構和網絡架構。
這要先看你的網站是作什麼的,每日有多少的人數訪問,
例如,我打算站點初期每日有
而後能夠用測試環境用軟件檢測在你的真實環境下的服務器壓力,好比在
那麼你能夠獲得你大體配置,其實市面上的標準服務器配置都足夠你用了,好比如今的
等服務器,足夠我跑一個這樣簡單的網站。其實說白了,雙奔
站點如今是一臺獨立服務器,將來採用的是分佈式架構,好比
mysql
哪些服務器能夠放在一個防火牆下,哪些服務器不用防火牆保護,哪些服務器是內網服務器,
須要什麼樣的網絡鏈接,最好是畫出大體拓撲,方便你預算設備花費。
說的簡單點就是買什麼機器,你能夠和
或者也能夠和我同樣,去挑選品牌服務器固然,如今你要看你服務器作什麼的,
你能夠親自去電腦城看組裝服務器,也能夠打電話到
固然你不要告訴他們你只買一臺,那你就別期望測試了。我告訴供貨商
那麼不到
最後就是價錢問題了,這個你本身看着辦吧。讓你公司的財務或者採購出馬砍價付錢就是了。固然,除了服務器的服務,你最好仍是想一想有利於本身的服務,好比人家公司能夠幫你拆箱子了什麼的。我作的最弱智的一件事情就是,來了
機器選型的時候你也要爲本身考慮,好比
首先要看你服務的地區是哪裏,而後再去找當地的電信機房。畢竟,雖然說全國已經互聯了,可是各地的網速仍是有差別的。
或者說有的
個人作法是在全國各個機房的服務器用
固然,你也能夠到你目標服務的地方,找個能夠上網的地方進行網絡測試,好比說網吧包個機器……
好了,網絡測試完了。那麼你已經決定去哪一個
而後你就能夠電話或者本身提着禮品登門拜訪一下
固然,你也能夠找代理服務商,由於他們拿到的價錢有時候比電信或者網通給你的價錢低,可是,關鍵仍是一個服務,由於你畢竟服務器放在那,晚上關鍵着急沒人給你重啓,機器出了問題其實按個
提着東西拜訪一下服務商老大是禮節性的東西,東西不在多而在精,這樣你將來談事情人家也給你綠色通道,作事情要好作不少。固然,我也不反對你空手去,你一次租個
最後你要知道如今的中國仍是賣方市場,你給人家牛,那你買的產品只能是……蒙牛
細心的檢查一下空調數量,空調出廠和最後維護日期,網絡佈線類型和架構,是否可擴展,主備從電力等。
基本都是很是關鍵的東西,出問題了,人家能夠給你更換一個新的,服務很好,可是你服務器掛一天的損失是多少,你能夠本身掂量。
還有機櫃電力,如今的機櫃放置
或者不限制你用電,可是插線板只有
最後,個人一個機房包間裏
結果我機器至少被熱死了
好了,要是你買的服務器到了,你會發現你接到電話後,樓下一個
我最黴氣的是:來了
你能夠說,找電信的幫忙撒,廢話,這個我還不知道。那我告訴你,我在某電信大樓工做時,從
雖然我在這個地方只幹了
你能夠說,僱民工撒,我又不是沒僱過,錢得你本身支付,公司不給你報銷的話,爽不?
下面是拆箱子,面對着堆積如山的
這時候,個人辦法是……我打電話找來了
這麼多箱子,除了機器和電源線留下,裏頭的導軌光盤等等你所有拿走,誰拆的多誰拿的多……
最後按照個人要求幫忙搬到機櫃上……因而咱們
因而人家
要是咱們幾我的拆,估計…………
最後再說個行價,服務器箱子一個價值
42U
好了,面對幾千臺服務器開始裝系統,我不知道你會怎麼想……
所有是
其次,咱們公司安所有要求:必須得一臺一臺安裝,先安裝光板的系統(好比沒有
辦法1
這個時候前期的準備就比較重要了(我公司多用
個人辦法是,我一看
固然這時候你最好是買個
辦法2
辦法3
辦法4
辦法5
還有更多的辦法,只是暫時沒想到,你們也能夠談論本身的辦法。互相交流嘛。(
因此我喜歡
windows
好了系統裝好了,電源線和網線鏈接完,和瀑布同樣的。這時候仍是儘可能把他扎一下吧。
不然機器通風不順暢,會致使熱死。
簡單辦法就是電源線扎一邊,網線扎一邊。有錢的公司能夠買個網線序號標,沒錢就本身拿膠布標。
你能夠隨便扎,或者和給你老婆梳頭同樣,好好扎。哈哈
插交換機的時候,從上往下,從
想來想去這裏也沒啥值得關注的地方。因此就幾行帶過。
假如你的機器只有
一共大約有
這時候怎麼辦?
每季度和財務小
到了機房就是我一我的幹活點資產,小
可憐咱們這些幹活的,短褲背心,
1,必須有資產管理系統,雖然這個實際上是個很簡單的數據庫,可是你能夠把每一臺機器的品牌,硬件信息,操做系統信息,購買年限,質保年限等,你很是關注的東西作一個詳細記錄,並配發同一的資產編號。
好比咱們的資產號,
服務器-
好比我如今的板凳就是一個資產號是:服務器-
購買時間是
有歷史吧……
2,送到機房
看過我這個服務器去過的地方,羨慕不?見證咱們公司的發展史。
服務器在購買合同肯定之後,就應該按照配置記錄資產,而且在財務備案,資產編號必定和財務記錄相同。這樣這個服務器走到哪裏,都有備案和記錄。如今要把這個服務器送到某個機房去,搬着走吧……汗
送到機房,咱們要給服務器按照財務給的表格粘貼資產編號,選個順眼的地方,不會磨損的地方。
通常是機器正面某個地方,而後是機器屁股後面某個地方,而後機器側面把手的地方,粘貼
而後在粘貼這個機器的應用資產號和
應用資產號舉例:
IP
而且在安裝服務器的時候。把
這樣遠程上來都很是清晰本身在哪一個服務器上,出問題時候也很是容易找到這個機器,不要閒麻煩,一切的麻煩都是爲了之後快速的解決
固然啦,甚至在密碼管理上你也能夠用這個規則來設置密碼,可是最好規則別讓別人知道了……
3,把這些信息所有錄入你的資產管理系統
系統無非服務器名,
4,資產系統軟件交互,也能夠說是監控系統。
企業能夠開發一個軟件,在裝機的時候安裝到服務器上。而後資產管理系統定時去取服務器上的信息,好比網絡流量,
固然啦,你也能夠在資產系統裏集成一個遠程桌面管理系統,自動載入用戶名和密碼,還有隨機碼,就能夠登陸系統。省的還得管理服務器密碼。
而後用戶的訪問權限不一樣,看到的節面權限就不一樣。
好比說,監控人員沒有登陸權限,或者
5,仍是IDC
話題繼續回到我和財務小
小
雖然按照資產管理系統裏導出的信息,機櫃號,
怎麼辦?
庫房管理的工做用上了,哈哈。你買服務器或者買筆記本電腦的時候有沒有注意到箱子上的條碼?
那個條碼很是清楚的記錄了這個機器的詳細信息。因此黑莓手機或者
那麼剩下的就簡單了。
去買個這種條碼標籤的打印機,編輯成本身須要的條碼,一個一個貼好,上面有你全部須要盤點的信息……
好比咱們是從資產到機櫃號到服務器名字到內外網
打印出來貼上去。而後買個掃描槍,和超市那種同樣,不過你要買有存儲功能的,不然你要端着筆記本去掃描,
而後我和財務
表上寫的很是清楚你哪一個機架沒有哪一個機器,哪一個機器不在特定的位置上,哪一個機器缺乏……等等
這樣好比說,機器位置不對扣
監控架構其實每一個地方都有本身的作法,我也知道個人辦法不是很先進,可是仍然拿出來和你們一塊兒討論
首先談談監控軟件,一提及這個經常使用的東西
要是要監控服務一類的,那就只好啓用大名鼎鼎的
或者就是本身作個腳本去定時探一下,不通了給你發郵件了啥的,你
做爲
天天看着這些流量圖是很枯燥的事情,那麼咱們沒事只能想辦法讓他自動報警給咱們了,因而
這裏只談經驗,不談詳細的技術,由於我一說個人系統架構地球人都知道我是哪一個公司的了,雖然已經離職,可是咱也有個職業道德,謝謝。
固然了,有些公司是有網絡監控部門的。可是我就一直在想這個問題,全部的數值均可以用短信報警,你隨時均可以收到信息。用這個部門幹啥,讓一羣可憐的傢伙
我就不清楚設置個節點,出現問題告訴人,人去操做會死啊,非要讓人和機器同樣一動不動的盯着顯示器,
上面的帖子位子已經滿了,下來的帖子在這裏寫。
我大概通讀了
1,自動化,流程化你的信息管理
爲何要自動化,這年頭流行辦公自動化,你丫沒事還拿着工單四處簽字,老土了吧。
爲何要流程化,這念頭流行流程管理,假如你公司沒有一個固定的流程管理,出了事情,你們都不知道怎麼作,各個部門的電話亂打,你們都一鍋粥沒有效率。因此,未雨綢繆,在沒有出問題的時候,模擬出問題,多多準備,創建規範的流程,公司的每一個人都要遵照,這樣,流程化的管理
上面說的是一個原理和意思,用這樣的理念去管理你的服務器應該如何去作?固然了,你假如只有
首先服務器採購錄入資產管理系統(詳細見上面有寫),服務器的去向和調度都在管理系統裏有提現。
這裏說的是:如何去上架,維修,下架等流程控制
先說上架下架:服務器到機房之後,別人要用服務器怎麼辦?先能夠到你的資產管理系統裏,看你機房還有什麼配置的機器多少臺,而後讓他們選擇本身項目服務器的配置,數量。在流程管理系統中,把這些機器選中,生成一個表單,表單名字爲
維修也同樣了,機器壞了,或者須要重裝系統,按照上面的流程,一步步走一遍,就能夠了。年末統計機房一天要幹多少活,省的某些領導認爲機房人
在流程系統裏重啓服務器,重啓服務器要是要流程,就太慢了,那麼你能夠作一個綠色通道,寫清楚緣由,重啓哪一個機器,直接提交給相關機房人員,在你的流程系統裏綁定一個短信網關,機房人員能夠收到須要重啓服務器的短信。準確無誤。
這樣代替了無紙化辦公,既有本身作的事情的每個記錄,又有相關人員管理,能夠量化本身的工做,省得年終獎的時候
2,如何升級你的服務器
服務器老了,或者須要加內存加硬盤,怎麼升級。
雖說是很簡單換個
可是,如何控制你的配件不丟失,肯定的安裝到機器上利用了呢?
簡單,在服務器上作一個探測服務器配置的客戶端,天天探測一次硬件配置發送到資產管理服務器上。
與資產管理系統的硬件配置作對比,出了問題就報錯發一封郵件到機房工做人員,抄送流程控制人員一封就能夠了。
至於的加內存的時候注意型號啥的問題就不說了,你們應該都沒問題了
要說的是,假如你一個機櫃上放的機器比較多,好比
簡單,一個辦法,可是仍是須要你有力氣,雖然有力學原理
好比有
你能夠拽住最下面的把
下面最關鍵:
拉到最後,前面要留出來一點,輕輕的把上面
上面
因此在推動去的最後仍舊要留一點在外面,最後放下來了再推動去這最後一點。
而後就能夠換或者加內存了。相對比較省勁,不危險,不會壓倒本身,不會砸壞服務器的辦法就是這樣了。
【編輯推薦】
大多數系統管理員小組時間緊、資金少。這種狀況下,要作的頭一件事就是,藉助自動化、時間管理和組織結構,最充分地利用現有資源。系統管理員須要掌握哪些軟技能?系統管理員怎樣才能減小工做場所中的壓力和衝突?本文將爲你提供一些指導。文章做者
系統管理員和系統運維的工做內容好理解,就是在技術上確保企業的
大多數系統管理員小組時間緊、資金少。這種狀況下,要作的頭一件事就是,藉助自動化、時間管理和組織結構,最充分地利用現有資源。一旦作到了這一點,小組經理就能夠改善系統管理員小組在別人心目中的見解和形象,從而爭取更多的資源。
應對資源缺少問題的一個好辦法是,使那些最耗費時間的任務實現自動化,從而爲系統管理員擠出更多的時間。自動化節省時間的途徑有兩個:一是讓任務更迅速地完成,二是確保一致性,從而減小支持電話。
推薦閱讀:
不妨先編寫一段腳本,讓輸出的命令可自動執行任務。系統管理員只須要審閱命令以確保正確,編輯命令以用於特殊狀況,而後把它們粘貼到命令行中。編寫這樣的腳本,一般比整個過程實現自動化更容易作到,有望爲流程實現進一步的自動化打下基礎。
與儘量實現任務的每一個方面都自動化的一套龐大系統相比,有助於處理普通狀況的一段簡單腳本可能更有用。使
尋找廠商提供的可以使操做系統安裝等任務實現自動化的工具,並積極使用它們。還要弄清楚如何使針對你環境所做的定製工做實現自動化。若是可能的話,使客戶常常請求的那些任務實現自動化,並創建一個網頁,讓這些請求成爲自助服務式請求。這個方法不但爲系統管理員和客戶都節省了時間,並且提升了客戶滿意度。
想最充分地利用可用資源,另外一個辦法就是運用各類衆所周知的時間管理方法。時間管理意味着明智地運用時間——更聰明地工做,而不是更賣力地工做。系統管理員如何更有效地管理時間,這個話題自己就能夠出一本書了。時間管理對系統管理員來講可能特別困難,緣由是他們的工做經常受到打擾。爲了提升工做效率,重要的是打破這個怪圈。你能夠把請求寫入到本身的我的待辦事項清單,告訴對方你稍後會處理請求,這樣能夠避免工做受到打擾。要是你無法把請求寫下來,那麼禮貌地請對方給你發送電子郵件或故障單請求。注意選用對你來講最恰當的措辭,讓對方以爲更容易接受。
一天當中工做效率最高、最不會受打擾的時間一般是早上,因此不要把這段寶貴時間浪費在收閱郵件上。迅速檢查一下監控系統,看看有沒有問題;瀏覽一下郵件,找出標記爲「緊急」的郵件。而後編輯你當天的待辦事項清單,肯定工做事項的輕重緩急;要是事項太多,從新安排一下,把一些不過重要的事項留到下一天。天天的事項儘可能排得細化點(好比半小時、一小時、兩小時或半天),前提是要適合本身。爲當天的待辦事項肯定輕重緩急,就更容易、更迅速地決定「下一步該怎麼作?」把這頭一個小時的其他時間用來處理優先級最高的事項。一天結束後,把待辦事項清單上仍沒有完成的事項從新挪到下一天的待辦事項清單上。
每次處理一個文件或電子郵件。要是你根本沒時間去處理,那看也不要看。每一個文件或郵件第一次就要徹底處理好,而不是擠成一堆,以後非得從新閱讀。你在處理每一個文件或郵件時,先看一下,決定是不讀就扔掉、讀後就扔掉、處理好後扔掉,仍是回覆後再扔掉?有時候,處理一個文件或郵件意味着要把它記入到待辦事項清單中。而有時候,你能夠立刻回覆郵件,或者把回覆意見寫到紙張文檔的空白處,而後交還給發送方。文件或郵件儘可能少歸檔。如有懷疑,就扔掉。
使盡量多的電子郵件處理工做實現自動化。好比說,自動將電子郵件歸類到不一樣文件夾,可按電子郵件列表或論壇、社交網站發來的通知、博客帖子、非垃圾郵件優惠券、最新資訊和廠商的特惠廣告來歸類。而後肯定你想多久掃描那些文件夾,收閱感興趣的內容,甚至能夠設置在某幾天後就自動刪除。讓文件夾將信息保存一段指定的時間(好比保存一週、一個月、兩個月、六個月或一年),而後自動刪除超過指定時間的郵件。要不斷完善和更新你的自動化機制。
保持注意力集中。乾淨的辦公桌、乾淨的電腦桌面、每一個任務的虛擬屏幕以及乾淨的電子郵件信箱,能夠減小分心、幫助你集中注意力。禁用電子郵件到達提醒功能也有幫助。安排好收閱電子郵件的時間,而不是當即收閱到達的每封郵件。《
千方百計減小每項任務所花的時間。自動化是能夠作到這點的一個方法。另外一個方法是預先想好決定,好比決定:始終在編輯文件以前先備好一份,隨身帶着我的數字助理(
讓系統管理員提升工做效率、少受到干擾,那樣能夠最充分地利用手頭的有限資源。從一項工做換到另外一項工做要花時間。系統管理員換着處理的工做越多,浪費的時間就越多,工做效率也就越低下。控制系統管理員在一天當中受到的干擾次數,恐怕是減少壓力、提升工做效率的最有效方法。
經過改變系統管理員小組的結構,就能作到控制干擾。對系統管理員小組進行劃分,以便一線支持人員處理客戶要求迅速予以處理的請求。處理起來比較費時間的請求則能夠交給二級工做人員。高級系統管理員則負責大型項目,好比建立服務。這樣的分工能夠確保:你的優先事項與你同事的預期要求相一致,保護正在處理長期項目的人員不會總是受到干擾。聽起來像是隻有龐大的系統管理員小組才能夠這麼作,但其實連只有兩名系統管理員的小組一樣能得益於這個方法。一名系統管理員能夠在早上保護另外一人不受干擾,而在下午對方反過來能夠保護他不受干擾。這個方法就是所謂的彼此保護不受干擾。
改善見解和形象
系統管理員面臨的許多壓力因素(包括缺少資源)可能來自於見解和形象方面的問題。
◆見解是指別人怎麼看待你;這是衡量質量的一種指標。
◆形象是指別人有多看重你;它是衡量數量的一種指標。
別人對你見解好的重要性很明顯;而形象好的重要性也許不大明顯。當系統管理員不引人注目時,同事可能以爲他們沒有在做貢獻、沒有忙於工做、人浮於事或資金過多,或者純屬多餘。這可能致使資金和人手不足,進而致使更壞的見解和更差的形象。
這裏討論的方法大多數側重於如何改善別人對系統管理員的見解。要注意:要是別人對你的見解很壞,須要大量時間和精力才能改變別人對你的見解。系統管理員能夠經過許多辦法來改善其工做在別人心目中的形象,但只有在真正把工做作好的時候,才應該竭力提高形象。換句話說,不要拿搞砸的產品大吹大擂。
好比說,要提高你的形象,能夠製做一個系統狀態網頁,以便你天天都出如今客戶眼前。製做的這個網頁還要有其餘實用信息和連接,以便它能夠成爲一個主頁。按期會見經理,既幫助他們瞭解你所作的工做,又幫助你在經理心目中有重要地位。
注意你的辦公場地。與客戶打交道的人應該選擇比較顯眼的辦公場地。能夠在市政廳舉行用戶組會議,那樣每一個想法、每一個請求或每一個批評均可以客觀公正地記錄下來。要弄清楚:記錄下來是爲了代表會認真考慮問題,未必是要落實什麼。
內部通信經常由系統管理員小組編制,但客戶不多去閱讀。編制內部通信要花大量工做,但是太容易被忽視。與客戶一塊兒吃午餐、參加社交活動是保持良好關係的一個簡單方法,並且一般比內部通信來得更有效、更省時間。
想爲你和你小組的正面形象負責任?那就要改善系統管理員小組在別人心目中的見解和形象。而系統管理員經理到時能夠利用小組的正面形象,爭取更多的資源。
將來須要怎樣的軟技能
因爲新技術的出現以及客戶要求愈來愈高,系統管理員的工做在不斷變化。那麼這些變化在如何改變所須要的哪些軟技能呢?
當我母親開始從事系統管理員(實際上是「操做員」)時,只有系統管理員才能使用機器;他們把同事的程序輸入到讀卡器,而後等程序處理完畢後,將結果返回給同事。她的同事對於多快完成完成的要求與咱們如今司空見慣的要求大不相同。她的客戶羣小得多,比較精通技術,但不像如今凡事都依賴電腦。她的工做也不像如今這樣常常受干擾;她沒有電子郵件要處理,她的一天主要是處理項目工做,而不是爲許多不一樣的人處理許多小的任務。所需的軟技能天生就與本文討論的那些軟技能不同。
在過去的四十年,系統管理員須要的軟性能發生了很大的變化;我預計,在接下來的四十年,會出現更大的變化,而這主要將歸因於技術方面的變化;可問題是,咱們不可能事先很早地預測到這些技術變化。不過咱們能夠預料:在接下來的幾十年,本文中討論的軟技能對系統管理員來講會變得愈來愈重要。
網絡一族的人數在繼續增長,而保持鏈接、與別人進行聯繫的方式也在繼續增長,於是使得溝通愈來愈以電子方式爲主。人們愈來愈要求「始終聯通」:若是你在線(爲何你不在線呢?),就能當即回覆任何消息。電子溝通不免會帶來干擾。時間管理和控制電子溝通,而不是讓電子溝通來控制咱們,將對每一個人來講會變得愈來愈重要,對常常受干擾的系統管理員來講尤其重要。
考慮到咱們你們收到的電子溝通數量勢必會繼續增長,咱們就要關注本身發送的信息的質量和數據。系統管理員必須學會簡潔扼要,態度又不能粗魯。這既節省了本身寫東西的時間,又節省了同事讀東西的時間。
系統管理員的客戶羣會變得越來地遙遠、愈來愈移動。對更多的人來講,遠程辦公將變得切實可行,在上下班途中辦公也會變得切實可行。外包和國際化辦公會繼續成爲兩大因素,讓系統管理員處在遠離客戶的地方。當系統管理員與同事沒有捱得很近時,他們須要確保處理好本文提到的見解和形象問題。另外值得一提的是,打電話經常比經過電子郵件或即時通信來聯繫遠地的同事更有效。這樣更有人情味,能夠更迅速地處理問題,並減少引發誤解的可能性。這還讓你有機會運用以前提到的溝通技能。
移動計算設備只會變得愈來愈廣泛——它們是每一個人確保工做效率的一個重要部分,儘管它們也隨之帶來了技術挑戰。不要排斥移動計算設備,而是要看到它們的好處,並積極迎接挑戰,而後知足你同事的支持要求。對於未來的技術,也要這麼作。要及早採用技術。關注最新技術如何有助於每一個人、爲此須要做什麼樣的變化。
隨着計算設備繼續變得更無所不在,以前獨立的系統會日益融入到系統管理員支持的計算機和網絡中。因爲愈來愈要求系統「正常工做」,一旦某部分中止運行,面臨的壓力也會愈來愈大。你的一些同事會提出一些更高的要求,而一些要求比較低的同事會依賴於你所支持的系統。你須要培養這種能力:與同事積極有效地溝通,並支持技術水平各異的客戶。
結論
系統管理員是一份充滿壓力的工做。可是一旦意識到形成壓力的某些因素,就能夠解決大部分的壓力,同時可以明白這份工做的確是值得的。有衆多方法能夠減小與同事的衝突、處理資源缺少問題和常受干擾的環境、解決優先事項相互衝突的矛盾,以及積極接受這個現實:系統管理員要對每個失敗負責。
【
原文:
本文分享的都是系統管理員在工做的時候容易犯的錯誤,好比安裝
本文分享的都是系統管理員在工做的時候容易犯的錯誤,經撫琴煮酒整理並提供解決方法,但願能夠給你們一些指導,避免在工做中出現此類問題。
做者簡介:餘洪春(
問題描述:
裝慣了
我要求
2G For /
4G For swap
10G For /root
256M For /boot
其他 for /usr
安裝正常,結果安裝重啓後便出現杯具了:
>> FreeBSD/i386 BOOT
Default: 0:da(0,a)/boot/kernel/kernel
boot:
緣由:
經過網上查資料,瞭解到手動引導的全過程,發現了問題所在:
因爲獨立分區
解決方法:
經過
boot: 0:da(0,e)/loader
能夠解決引導問題,而後進入
*
一樣因爲默認
ok load kernel/kernel
得到
ok boot
這樣就能夠正常引導了。
可是這樣尚未完全解決問題,隨後還須要在磁盤掛載的時候輸入
mount root>ufs:/dev/da0s1a
才能進入系統,並且每次重啓都手動一次。因此其實問題沒有完全解決。
因此,爲了不以上的
2048M For /
4096M For swap
其他的均For /usr
問題描述:
公司有系統管理員離職了,有很多
解決辦法:
你們養成好習慣,每次更改完
問題描述:
系統總監嫌託管的新
解決方法:
這個問題只要養成良好的習慣就能夠預防,就是你們更改完
問題描述:
我在配置某機房
解決方法:
下面介紹的這個方法及其有用,強烈推薦給你們:爲了預防此類問題出現,能夠配置一計劃任務
*/5 * * * * root /bin/sh/root/firestop.sh
firestop.sh
service iptables stop
這樣即便你的腳本存在錯誤設置(或丟失的)規則時,也不至於將你鎖在計算機外而沒法返回與計算機的鏈接。這樣你就能夠放心大膽的調試你的腳本啦。這都是生產環境下逼出來的,呵呵。
問題描述:
同事在處理
解決辦法:
耐心跟他講解了
mount –o remount,rw /
將
問題描述:
同事遠程處理一臺機房的
解決方法:
這時只有請專人到機房去處理問題了……
問題描述:
一個開發小組都是用內部機房的
解決辦法:
此時處理辦法有
問題描述:
咱們的
/libexec/ld-elf.so.1: Shared object "libintl.so.8" notfound, required by "bash"
Connection to 192.168.21.36 closed.
解決方法:
①用單用戶模式進入系統;
②掃描磁盤
fsck -y
③將文件系統從新掛載
mount -a
④將
chsh -s sh
重啓後一切正常。
問題描述:
普通用戶用
解決辦法:
其實只要保存時加上:
:w !sudo tee %
就能夠了。
「
系統管理員容易犯的錯誤和解決方法暫時就總結到這裏,但願對你們有幫助!若是你們有什麼問題,也歡迎在評論中溝通。
【
【編輯推薦】
系統管理員在面對書寫文檔的要求時,總會拿「系統應該自我記錄」或「我沒有時間寫文檔」爲擋箭牌而拒絕編寫文檔,甚至還有人認爲「缺少文檔使他的工做更安全」。但事實上,這些理由都是荒謬的。一個優秀的系統管理員應該將適當經歷投入到良好文檔的編寫當中去。
本文是上週在美國召開的
系統管理員在面對書寫文檔的要求時,總會拿「系統應該自我記錄」或「我沒有時間寫文檔」爲擋箭牌而拒絕編寫文檔,甚至還有人認爲「缺少文檔使他的工做更安全」。
我對這個課程特別感興趣,由於我是
編寫文檔時首先應該考慮的是誰是目標讀者。若是目標讀者是管理員,客戶或管理層,那麼文檔的風格和內容將有所不一樣。弄明白目標讀者後,寫起文檔來思路也會更清晰,最終的文檔用途也更大。
高效編寫文檔的關鍵是在讀者已經知道的須要知道的內容之間創建起鏈接,列舉讀者已知的一些內容能夠幫助他們理解文檔和減小文檔被駁回的可能性。試問若是你寫的文檔目標讀者都已經所有了解了,那你這個文檔還有存在的必要嗎?一樣,若是你寫的文檔讓目標讀者丈二和尚摸不着頭腦,那麼他們會有興趣讀下去嗎?
重要的信息在文檔中可能會出現屢次,但要注意措辭適當,不要一味使用重複的字眼,那樣會讓讀者以爲你在反覆炒剩飯。
編寫文檔時還須要注意語態。若是是技術文檔,經常使用被動語態,若是是教學用文檔,使用主動語態更好(編者注:這個比較適用於英文的狀況)。此外還須要注意詞性,不要表錯了情,會錯了意。象對待卷宗同樣對待文檔是個好主意,舉證責任在撰稿者,前面沒有介紹過的東西在後面就不能提,不然在接受盤問時你會被問的四分五裂。
文檔寫完後,編輯和校對很重要。編輯最好由理解材料的人進行,他們能夠幫助從新排列文檔章節以提升可讀性;校對則須要敏銳的眼光審查拼寫和語法,校對人員不必定要徹底瞭解文檔中的技術術語。通過編輯和校對的文檔應該拿給既不是目標讀者,又不熟悉該主題的人閱讀。若是他讀完後不能根據文檔的內容肯定目標讀者,那說明文檔還存在嚴重的問題。原本你是寫給同爲系統管理員的人看的,但卻不見一條命令或操做步驟,這就比如是牛頭不對馬嘴,這樣的文檔只能被扔進垃圾桶。
系統管理員必須展現文檔對本身的工做和整個組織都是有益的,不然就沒有存在的必要。
有多人蔘與編寫相同的文檔時,就涉及到使用協做工具了。沒有哪個協做工具是最好的,重要的是肯定需求,選擇最適合的工具。通常來講,任何工具都可以處理多種格式的文檔(如數字和印刷)。
文檔寫完後事情並無就此結束,還應該按期評估和保持更新。確保文檔的準確性很是重要,若是不這樣作,文檔就會漸漸失去其價值,這種狀況在現實工做中是很常見的。一開始你們都興致勃勃地編寫文檔,當寫完後就放在硬盤的某個角落,無論文檔記錄的事情如何變化,都無人再問津,長此以往,文檔就成了擺設,等到須要使用的時候才發現文檔已經失效了。所以文檔應常常更新,養成良好的文檔維護習慣是成爲優秀系統管理員的必備素質。
原文:
【編輯推薦】
本文是一位資深系統管理員所寫的職場經驗。對於剛剛入職的系統管理員來講,這些都是十分寶貴的意見和建議。本文做者告訴你們如何處理好在企業內同事與領導之間的關係。相信剛剛走進系統管理員的你會對本身的工做明朗不少。
編者按:本文是一位資深的系統管理員對本身工做經歷的描述,而且告訴你們在職場中須要注意的事情。這些寶貴的經驗對於一個剛剛入職的系統管理員來講無疑是一份無價的財富。
1、良好的人際關係比什麼都重要。
俗話說得好:先作人,再作事,良好的人際關係是你成功的關鍵條件之一和愉悅工做的基本條件之一,千萬不要覺得技術第一,其實技術人成功的條件之中,技術未畢是排在第一位的。其實在公司的人事架構中,技術類崗位每每是排在中下位的,因此我以爲僅僅只跟本部門的技術類同事打交道是不夠的;你應該多跟其它部門的同事,如行政部、人事部等部門的同事多接觸下,多瞭解下公司的企業文化和內部規定及人事架構,這樣對本身的成長也是有幫助的;撫琴煮酒之前在公司上班時,每每三個月都不知道本身公司的董事長和總經理長什麼樣,其實這樣很差,萬一哪裏在他們內心留下一個目空一切的印象,很影響仕途的噢。儘可能在不影響公司的內部規定的前提下,幫助能幫助的人,多跟其它部門的同事多聊聊,多溝通,這樣就算你是在一個新公司裏,也可以很快溶進去,很快進入本身的角色。
2、正確處理跟本部門同事的關係。
有句老話:不要跟同事作朋友。很不幸,這句話並不能適用在系統管理員身上。若是是一個大型公司,好比超過
切忌的二件事:第1、不要以技術壓人,這個沒意思,我歷來不做;2、也不要以老員工的身份欺負技術新人,這個更不推薦了,這隻能說明你的無知。系統管理的工做其實就是搭積木,只要願意花時間的話基本沒什麼難度。而網絡及網絡安全這塊,我跟他們溝通得就更多了,好比要將內網的某臺服務器做
不要冷冰冰的作人,一張笑臉比什麼都重要。在本部門同事的處理關係上,個人作法是:能作同事就作同事,能作朋友就儘可能作朋友,畢竟多一個朋友多一條路;因此,之前公司的同事們,只能可以聊得來的,我基本都保持聯繫;平時或週末都會跟他們聚下餐,你們輪流聊會天,既減輕壓力,又相互瞭解對方公司的一些趣事,何樂不爲
關於飲酒·聚餐
週末,同事聚餐。咱們選擇是平時總在一塊兒吃飯的地點「三顧茅蘆」,點了六個菜,連我在內四我的,我作東;由於前面幾回都是同事們請了,此次算我回請,咱們實行輪詢制
3、碰見領導要服軟。
二個原則:1、在原則性的問題要服從上級領導的管理;2、千萬不要越級報告,不管是國營仍是外企,這二個心得體會贈予給剛剛上班的小憤青們,若是確實體會不了,建議仔細閱讀《杜拉拉昇職記》三部文章,裏面許多故事都是挺真實的,特別是越級報告這個問題,短時間來看,你可能會取得局部的勝利,但從長遠來看,你絕對是最大的輸家,由於沒有領導會喜歡一個越級報告的下級,哪怕你的能力再高也是同樣。撫琴煮酒第一工做是在某大型國營企業作企業網管,主要是負責
我當時就很迷惑:爲何許多沒有能力的人都當了
4、明確你的發展定位也是很重要的。
做爲一個系統管理員,即
另外,這裏說個題外話,英語對系統管理員很重要,由於許多新產品和新技術,基本上都是從國外引進的;要想熟練的掌握及應用,英文是必不可少的基本功之一;而外企是不用說了,咱們向國外的上級
5、系統管理員必定要明確本身的企業定位。
老闆們如今愈來愈喜歡
做爲系統管理員,並非你的做用有多大,而是你將技術轉爲生產力有多高而矣,因此千萬不要覺得公司缺了你就不轉,必定要抱着日常心的態度去工做和生活,我如今認識的大牛們,基本上都是謙虛和平民化的,這個也值得咱們學習。平時仍是要注意學習的,畢竟新技術是層出不窮的,能力不是天生的,這個須要後天培養。你還能夠經過博客等形式發佈本身的工做或者學習心得,或是率先掌握一門新技術,並率先向社會推廣這門新技術。分享是一門藝術。在分享的同時,必定會伴隨着理解、應用、總結、提升、表達甚至推廣方面的提升,這對我的的技術提升和社會影響力的創建有着很是的意義的,這個目前我也是努力的方向和目標之一。
6、必定要有效率和簡單的工做。
其實做爲系統管理員,許多工做都是重複性的,特別是一些維護和備份工做,這個時候你徹底能夠編寫一段
7、系統管理員要明白本身在公司的做用。
做爲系統管理員,通常都會職守公司的
另外,隨便透露公司的資料及敏感信息、上班時間接私活,這些事情儘可能都不要作,都是些犯忌諱的事情;另一件事就比較頭疼的事情就是,每一個公司,不管大小,都會有一些政治鬥爭,這個時候該怎麼辦了
下次工做時,記得找一個工做環境比較單純點,這些事情其實碰見一次是好事
8、其它方面就是身體相關了。
有時候,服務器遷徙的活仍是比較重的,
另一個就是夜班值守的問題,這個就比較頭疼了。我通常就是白天注意多休息下,晚班的時候會將手機郵開通,音量調到最大,下半夜時能睡會是一會。別的網站崩潰了沒關係,若是是電子商務型和廣告類型的,那就是錢了。因此係統管理員也要注意鍛鍊身體,平時能夠辦一張健身卡,週末去鍛鍊下身體,平時能走路的話就不要打車了。
另外,要注意內心方面的壓力,由於咱們的平均故障處理時間不能超過
做者博客:
【編輯推薦】
春節長假將至,有些系統管理員們被老闆要求寫一份公司的軟硬件維護清單,對於沒寫過此類文檔的運維朋友們而言會感到很苦惱。本文整理收集了一些軟硬件系統維護清單,有些來自微軟、
春節長假將至,有些系統管理員們被老闆要求寫一份公司的軟硬件維護清單,對於沒寫過此類文檔的運維朋友們而言會感到很苦惱。
系統維護清單該怎麼寫?
其實不光是在長假先後,系統管理員平時也應該養成按時(好比天天、每週、每個月)按照維護清單進行軟硬件維護的習慣。
簡單而言,系統維護主要包括以下幾個方面:
保持軟件和系統的更新。軟件更新一般包含
殺毒軟件的更新和按期查殺病毒。
檢查你的系統監控數據是否無缺的保存。各類監控。
檢查系統的備份是否無缺的保存。備份的重要性相信不用再強調了!
檢查機房的物理環境,如溫度、溼度等。
檢查硬盤
……
從某種角度而言,系統維護清單都應該是系統管理員們必須遵照的鐵律。
具體的系統維護清單,其實很多廠商(尤爲是微軟和
微軟BizTalk Server
Steps
|
Reference
|
Check for failed disks in the hardware RAID (reliability check).
|
"View Disk Properties" in the Windows Server 2003 product Help at http://go.microsoft.com/fwlink/?linkid=104161
|
Check for messages requiring manual intervention such as suspended messages (reliability check).
|
For information about manually checking for suspended messages see "Investigating Orchestration, Port, and Message Failures" in BizTalk Server 2006 R2 Help at http://go.microsoft.com/fwlink/?linkid=104169
For information about performing automated monitoring using Microsoft Operations Manager 2005 see "Suspended Message Alerts" at http://go.microsoft.com/fwlink/?linkid=105059
|
Check the event logs for errors and warnings (administration check).
|
BizTalk Server 2006 R2 errors and warning events are saved in the application log. The event source is "BizTalk Server 2006". We recommend that you monitor the event log using an automated solution such as Microsoft System Center Operations Manager. For more information, see Monitoring with MOM 2005 or Operations Manager 2007.
|
Steps
|
Reference
|
Ensure that each host has an instance running on at least two physical BizTalk servers (reliability check).
|
|
Ensure that each receive location is redundant (reliability check).
|
|
Ensure that the SQL Server Agent service is running on the SQL server (administration check).
|
Monitoring SQL Server Agent Jobs
How to Start the SQL Server Agent
Monitoring SQL Server Agent Jobs and Databases
"SQL Server Agent" in SQL Server 2005 Books Online athttp://go.microsoft.com/fwlink/?LinkId=106728
|
Ensure that all SQL Server jobs related to BizTalk Server are working properly (administration check).
|
|
Ensure that the SQL Server jobs responsible for backing up BizTalk Server databases are running normally (administration check).
|
|
Ensure that the latest security updates are installed (security check).
|
Microsoft Update site at http://update.microsoft.com/microsoftupdate/v6/default.aspx
|
Analyze weekly performance monitoring logs against baseline and thresholds (performance check).
|
Monitoring Throttling Using Performance Threshold Rules
Using the Performance Analysis of Logs (PAL) Tool
|
Ensure that the system is not experiencing frequent auto-growth of BizTalk Server databases (performance check).
|
Defining Auto-Growth Settings for Databases
Guidelines for Sizing the Tracking Database
Identifying Bottlenecks in the Database Tier
"Database File Initialization" in the SQL Server 2005 Books Online athttp://go.microsoft.com/fwlink/?LinkID=101579.
"SQL Server Maintenance" in Best Practices for Configuring SQL Server
|
Run SQL Server Profiler during high load to check for long response times and high resource usage (performance check).
|
"Using SQL Server Profiler" in the SQL Server 2005 Books Online athttp://go.microsoft.com/fwlink/?LinkID=106720
|
Ensure that message batching for all adapters is appropriate for resource consumption or latency (performance check).
|
Configuring Batching to Improve Adapter Performance
"How to Design a Performant Adapter" in the BizTalk Server 2006 R2 Help athttp://go.microsoft.com/fwlink/?LinkId=106720
|
Ensure that the large message threshold is appropriate for resource consumption (performance check).
|
How to Adjust the Message Size Threshold
"How BizTalk Server Processes Large Messages" in the BizTalk Server 2006 R2 Help at http://go.microsoft.com/fwlink/?LinkId=82351
|
Steps
|
Reference
|
Ensure the master secret key is backed up and readily available on offline storage (reliability check).
|
|
Ensure that failover for all clustered services has been tested (reliability check).
|
|
Ensure that the Enterprise SSO service is clustered (reliability check).
|
|
Ensure that the BizTalk Server databases are clustered under SQL Server services (reliability check).
|
|
Ensure that at least two physical BizTalk servers are part of the BizTalk group (reliability check).
|
|
Determine whether any unstable code is being used, and if so, use separate hosts (reliability check).
|
|
Perform functional testing of all new BizTalk applications (reliability check).
|
"Staging Tasks for BizTalk Application Deployment" in BizTalk Server 2006 R2 Help athttp://go.microsoft.com/fwlink/?LinkID=103092.
|
Determine whether there are any unnecessary BizTalk applications, artifacts, and configurations (administration check).
|
Remove all unnecessary BizTalk applications, artifacts, and configurations.
For more information about removing a BizTalk application or artifact using the BTSTask command-line tool see "RemoveApp Command" in BizTalk Server 2006 R2 Help athttp://go.microsoft.com/fwlink/?LinkID=106721.
For more information about removing an artifact from an application using either the BizTalk Server Administration console or the BTSTask command-line tool, see "How to Remove an Artifact from an Application" in BizTalk Server 2006 R2 Help at http://go.microsoft.com/fwlink/?LinkId=106722.
|
Check the BizTalk Server Administration console for any non-approved changes (administration check).
|
"Using the BizTalk Server Administration Console" in BizTalk Server 2006 R2 Help athttp://go.microsoft.com/fwlink/?LinkId=106723.
|
Check BTSNTSvc.exe.config for any non-approved modifications (administration check).
|
"BTSNTSvc.exe.config File" in BizTalk Server 2006 R2 Help at http://go.microsoft.com/fwlink/?LinkId=106724.
|
Check the BizTalk Server-related registry keys for any non-approved modifications (administration check).
|
"Windows registry information for advanced users" article at http://support.microsoft.com/kb/256986
|
Run the Best Practices Analyzer for BizTalk Server (administration check).
|
"BizTalk Server 2006 Best Practices Analyzer" article at http://go.microsoft.com/fwlink/?LinkId=83317
|
Ensure that the latest service packs and updates are installed (administration and security check).
|
Microsoft Update site at http://update.microsoft.com/microsoftupdate/v6/default.aspx
|
Ensure that the artifacts for different trading partners are not installed on the same host (security check).
|
|
Ensure that BizTalk Server is using only domain-level users and groups (security check).
|
"Domain Groups" in BizTalk Server 2006 R2 Help at http://go.microsoft.com/fwlink/?LinkId=106725.
|
Ensure that the MSDTC Security Configuration is enabled (security check).
|
"Set the appropriate MSDTC Security Configuration options on Windows Server 2003 SP1 and Windows XP SP2" entry in "Troubleshooting Problems with MSDTC" in BizTalk Server 2006 R2 Help athttp://go.microsoft.com/fwlink/?LinkID=101609.
|
Determine whether the BizTalk Server cache refresh interval needs to be increased (performance check).
|
|
Determine whether the throttling options of each host need to be adjusted (performance check).
|
|
Determine whether unnecessary tracking is enabled, such as orchestration, shape, and Business Rule Engine (BRE) event tracking (performance check).
|
Best Practices for Maintaining Performance (under "Monthly Performance Checks")
"Best Practices for Health and Activity Tracking" in BizTalk Server 2006 R2 Help athttp://go.microsoft.com/fwlink/?LinkId=106726.
|
Determine whether you are using a dedicated host for tracking maintenance (performance check).
|
|
Determine whether the default XML send pipeline is being used instead of the PassThrough send pipeline (performance check).
|
"Managing Send Ports Using BizTalk Explorer" in BizTalk Server 2006 R2 Help athttp://go.microsoft.com/fwlink/?LinkId=106727.
|
Check the BizTalk Server database sizes for an increasing trend (performance check).
|
For more information about sizing the tracking database, see Guidelines for Sizing the Tracking Database.
For more information about sizing the MessageBox, BizTalkDTADb, and BAMPrimaryImport databases, see Identifying Bottlenecks in the Database Tier.
|
Determine whether the system is encountering database contention (performance check).
|
For more information about avoiding contention in the MessageBox database, see Avoiding Disk Contention.
|
IBM Lotus Domino
Task
|
Frequency
|
Back up the server
|
Daily, weekly, monthly
|
Monitor mail routing
|
Daily
|
Run Fixup to fix any corrupted databases *
|
At server startup and as needed
|
Monitor Administration Requests database (ADMIN4.NSF)
|
Weekly
|
Monitor databases that need maintenance
|
Weekly
|
Monitor replication
|
Daily
|
Monitor modem communications
|
Daily
|
Monitor memory
|
Monthly
|
Monitor disk space
|
Daily, weekly, monthly
|
Monitor server load
|
Monthly
|
Monitor server performance
|
Monthly
|
Monitor Web server requests
|
Monthly
|
Monitor server first domino servers
|
Daily
|
另外也有非官方文檔,其餘系統管理員的經驗分享:
The Basics
|
|
|
Hardware Manufacturer:
|
|
|
Model Number:
|
|
|
Serial Number:
|
|
|
Tower/Rack/Blade
|
|
|
Physical Location of Server:
|
|
|
Purchase Date:
|
|
|
Warranty/Service Contract Number:
|
|
|
Warranty/Service Telephone Number:
|
|
|
Date Warranty Expires:
|
|
|
|
|
|
CPU
|
|
|
Number of CPU Sockets:
|
|
|
Number of Installed CPUs:
|
|
|
CPU Model:
|
|
|
CPU Ghz Speed:
|
|
|
Number of Cores per CPU:
|
|
|
Type of Hyperthreading:
|
|
|
Is Hyperthreading on or off:
|
|
|
CPU L2 Cache Size:
|
|
|
CPU Bus Speed:
|
|
|
Motherboard BIOS Version:
|
|
|
Is BIOS Version Current:
|
|
|
|
|
|
Memory
|
|
|
Current Amount of RAM:
|
|
|
Additional RAM Capacity Available:
|
|
|
Number of Memory Slots Used:
|
|
|
Number of Memory Slots Available:
|
|
|
ECC Memory:
|
|
|
|
|
|
Network Adapter
|
|
|
Hardware Manufacturer:
|
|
|
Model Number:
|
|
|
Speed:
|
|
|
Number of Ports per Card:
|
|
|
Number of Cards:
|
|
|
BIOS Version Number:
|
|
|
Is BIOS Version Current:
|
|
|
NIC Speed/Duplex Setting:
|
|
|
Is the NIC Power Saving Feature Off:
|
|
|
|
|
|
Storage
|
|
|
Type: Local, DAS, SAN, Combo:
|
|
|
|
|
|
Local/Integrated RAID Controller
|
|
|
Number of Local RAID Controllers:
|
|
|
Type: SCSI, SAS, etc.
|
|
|
Controller Hardware Manufacturer:
|
|
|
Number of Ports:
|
|
|
Controller Model Number:
|
|
|
Controller Cache Size:
|
|
|
Is There a Cache Battery:
|
|
|
Is Write Back Caching On:
|
|
|
Controller BIOS Version Number:
|
|
|
Is Controller BIOS Version Current:
|
|
|
|
|
|
External RAID Controllers
|
|
|
Number of External RAID Controllers:
|
|
|
Type: SCSI, SAS, etc.
|
|
|
Controller Hardware Manufacturer:
|
|
|
Controller Model Number:
|
|
|
Number of External Ports:
|
|
|
Controller Cache Size:
|
|
|
Is There a Cache Battery:
|
|
|
Is Write Back Caching On:
|
|
|
Controller BIOS Version Number:
|
|
|
Is Controller BIOS Version Current:
|
|
|
|
|
|
Local Disk Configuration
|
|
|
RAID Configuration:
|
|
|
Number of Physical Drives:
|
|
|
Physical Dimension of Drives:
|
|
|
Drive Capacity:
|
|
|
Drive Speed/RPM:
|
|
|
Total Available Disk Space:
|
|
|
|
|
|
HBAs for External Storage
|
|
|
Number of HBAs:
|
|
|
Type: iSCSI, Fibre Channel, etc:
|
|
|
Type of Connectors:
|
|
|
HBA Hardware Manufacturer:
|
|
|
HBA Model Number:
|
|
|
HBA BIOS Version Number:
|
|
|
Is HBA BIOS Version Current:
|
|
|
|
|
|
DAS Disk Configuration
|
|
|
RAID Configuration:
|
|
|
Number of Drives:
|
|
|
Physical Dimension of Drives: |