數據庫巡檢linux
每一個公司的數據庫巡檢不同,可是巡檢的內容是同樣的。
檢查的內容:
1.操做系統 (運維工程師)
內存的使用狀況,磁盤的使用狀況,swap空間的大小
2.存儲的可用性(出了問題,趕快找廠商) (存儲工程師)
3.網絡通不通,網絡的帶寬夠不夠用。通常使用監控軟件(網絡工程師)
4. DBA
1>天天查看告警日誌
ORA--- //數據庫已經存在錯誤,應用或者系統有問題須要當即解決
WARING-- //數據庫存在告警,須要關注和解決
windows系統中放到審計路徑下
linux默認路徑:10g---- $ORALCE_HOME/admin/alter/alter_SID.log
11g-----$OARACL_BASE/diag/rdbms/db_unique_name/instance_name/trace/alter_sid.log
background_dump_dest:
2>datafile
數據庫中有哪些數據文件,狀態是否正常(online|offline|recovery ),文件是否存在
表空間的大小,表空間的狀態,空間使用狀況(沒有使用自動擴容,80%以上就須要擴容)
3>redo logfile 日誌文件
項目中至少3個組,每一個組至少2個成員,系統文件中是否有查看物理文件是否存在,狀態是否正常。日誌切換頻率,若是日誌切換的時間少於15分鐘,用視圖v$log_history
SQL> select FIRST_CHANGE#,FIRST_TIME from v$log_history;數據庫
4>控制文件的大小通常控制在100M,若是超過100M咱們須要清空控制文件,即重建日誌文件。三個月到半年巡檢一次,重建
5>歸檔,密碼文件,參數文件
6>備份,天天都要檢查 檢測備份的有效性,過時的備份可刪除,備份都不要刪
crosscheck backup //檢查備份是否可用
list failure //檢查備份文件是否存在壞塊,列出有問題的文件,能夠用repair failure 去修復壞塊
7>檢查DG日誌的應用狀況,狀態是否正常。
v$archived_log //查看主備的seq,apply 兩邊是否同步
8>rac 關注實例運行狀態是否正常,
srvctl status database -d db_unique_name //查看實例是否正常
網絡是否正常,磁盤是否都mountwindows
9>數據庫的性能,cpu ,內存的使用 須要用報表 awr---- 或者 addm 或者v$sga_advice 須要在業務高峯期的狀況下網絡
巡檢過程必須造成報告:
1.檢查目的
2.巡檢的內容,指出存在問題,給出問題解決的建議
3.dblink是否能正常連建,tnsname文件
4.網絡是否存在問題,系統是否存在問題
5.發給領導app