1.平常服務器運維部自我巡檢:
(1)每日早8:00經過cacti監控軟件查看全部服務器總流量、單兵流量、CPU和內存使用狀況、硬盤使用狀況等運行是否正常。
(2)對異常單兵服務器進行查看CPU、內存佔用率等進行詳細分析和排查。
(3)對異常單兵進行全部服務進程檢查,看是否正常,並進行排查。
(4)查看使用用戶,是否有異經常使用戶登陸。若有異經常使用戶登陸,查看該用戶下的文件,是否有木馬、病毒或有威脅的文件,進行刪除和維護。
(5)查看服務器系統是否須要打新的補丁,如需升級,進行升級。
(6)在服務器和本機上同時對網頁的打開速度進行測試,登錄到系統上查看系統頁面中程序運行是否正常。 是否正常。
(7)對公司五大系統接口進行打開測試查看是否正常。
測試內容:
集採平臺打開測試;
便利店系統打開測試;
雲倉儲接口打開測試;
雲管理接口打開測試;
雲支付買買金接口打開測試。
2.周和月服務器運維部自我巡檢:
經過查看監控周流量和月流量、服務器各項硬件使用狀況查看等分析
(1)在管理工具中查看事件查看器中的應用、安全、系統、日誌中的工做狀態,是否有異常狀況,若有進行清除和修復,每星期進行一次清除工做。
(2)每兩個星期檢查一次操做系統日誌。
(3)每星期定時對服務器的網站程序文件進行備份。備份原則上採用數據庫徹底備份加日誌備份策略、web前端增量備份;
一、備份數據存儲策略:本機、異機、2個級別。
二、重要更新時間點先後必須作數據庫備份或日誌備份,特別是在作數據庫表更新、應用程序更新。
三、天天檢查全部數據庫備份操做是否正確完成、異地傳輸是否正常完成,並填寫檢查表。
四、在異地備份數據準確存儲後,能夠將超過2周 以上的異機備份數據經過自動刪除腳本進行刪除,以便騰出存儲空間。
(4)爲保證服務器系統正常運行,每星期對系統盤C盤進行垃圾清理和維護。
(5)在數據庫服務器、關鍵應用服務器上,只能有數據庫DBA人員的賬號,開發人員須要介入時,填寫開發人員使用數據庫申請單向上級申請。
3.運維部自我巡檢周和月工做總結:
對一個月內服務器系統的運行狀況進行彙總,把解決的問題及不能解決的問題概括總結並向上級領導提交,經過會議形式決定解決辦法和執行方式來解決所面臨的問題。
4.機房協助巡檢:
機房每週會對機櫃使用狀況、流量峯值狀況、機櫃溫度、溼度等進行巡檢,每週發送到公司運維部,進行評估和查看
五、服務器硬件按期更換和清理: 針對全部服務器硬件清潔期限和更換以下: 一、每一年進行服務器灰塵開蓋清理,經過機房人員協助; 二、對於存儲硬盤,期限爲兩年更換一次,保證硬盤的正常使用; 三、電源模塊測試,如有欠壓和損壞的進行完全更換。