SQL Server自動化運維繫列——監控磁盤剩餘空間及SQL Server錯誤日誌(Power Shell)

需求描述shell

在咱們的生產環境中,大部分狀況下須要有本身的運維體制,包括本身健康狀態的檢測等。若是發生異常,須要提早預警的,通知形式通常爲發郵件告知。服務器

在全部的自檢流程中最基礎的一個就是磁盤剩餘空間檢測。做爲一個高效的DBA不可能天天都要上生產機上查看磁盤剩餘或者直到磁盤無剩餘空間報錯後才採起擴容措施。架構

固然,做爲微軟的服務器有着本身的監控軟件:SCCM(System Center Configuration Manager)。但本篇就介紹若是經過Power shell實現狀態值監控,相比SCCM更輕量級和更具靈活性。app

本篇實現運維

一、天天檢測磁盤剩餘空間大小,若是剩餘空間超過了閥值,則發郵件告訴管理員測試

二、天天檢測SQL Server運行的錯誤日誌(Window平臺的錯誤日誌),造成郵件附件發送給管理員優化

 監控腳本ui

 首先咱們來解決第一個問題,關於磁盤剩餘空間的問題,對於磁盤的監控的存在兩個須要解決的問題:spa

 <1>通常監控咱們須要監控不少臺服務器的磁盤,因此對於服務器的量控制咱們須要生成一個配置文件。代理

<computernames>
        <computername>
                wuxuelei-pc
        </computername>
</computernames>

配置文件名字:computername.xml,這樣就解決不少服務器的問題,只須要在配置文件中增長就能夠,由於我在本地測試,因此就配置了個人本地電腦

<2>對於服務器的磁盤監控也須要定義一個閥值,用來動態改變,用來定義生成預警的閥值。簡單點就是定義咱們檢測的磁盤剩餘空間到了多少了就自動發郵件提醒。

<Counters>
        <Counter alter = "10" operator = "gt" >C:</Counter>
        <Counter alter = "10" operator = "gt" >D:</Counter>
        <Counter alter = "10" operator = "gt" >E:</Counter>
        <Counter alter = "10" operator = "gt" >F:</Counter>
</Counters>

文件名爲:alter_disk.xml,我定義了四個盤符:C: D: E: F:

當以上四個盤符那個盤符少於10G了就生成郵件預警。

實現代碼以下:

$server = "(local)"
$uid = "sa"
$db="master"
$pwd="password"
$mailprfname = "TestMail"
$recipients = "787449667@qq.com"
$subject = "老大,快去看看這個服務器的磁盤空間立刻就不夠了!"
$computernamexml = "F:\PowerShell\發送郵件\computername.xml"
$alter_xml = "F:\PowerShell\發送郵件\alter_disk.xml"
function GetServerName($xmlpath)
{
    $xml = [xml] (Get-Content $xmlpath)
    $return = New-Object Collections.Generic.List[string]
    for($i = 0;$i -lt $xml.computernames.ChildNodes.Count;$i++)
    {
        if ( $xml.computernames.ChildNodes.Count -eq 1)
        {
            $cp = [string]$xml.computernames.computername
        }
        else
        {
            $cp = [string]$xml.computernames.computername[$i]
        }
        $return.Add($cp.Trim())
    }
    $return
}

function GetAlterCounter($xmlpath)
{
    $xml = [xml] (Get-Content $xmlpath)
    $return = New-Object Collections.Generic.List[string]
    $list = $xml.counters.Counter
    $list
}

function CreateAlter($message)
{
    $SqlConnection = New-Object System.Data.SqlClient.SqlConnection 
    $CnnString ="Server = $server; Database = $db;User Id = $uid; Password = $pwd" 
    $SqlConnection.ConnectionString = $CnnString 
    $CC = $SqlConnection.CreateCommand(); 
    if (-not ($SqlConnection.State -like "Open")) { $SqlConnection.Open() } 
    
    $cc.CommandText=
            " EXEC msdb..sp_send_dbmail 
             @profile_name  = '$mailprfname'
            ,@recipients = '$recipients'
            ,@body = '$message'
            ,@subject = '$subject'
            "
    $cc.ExecuteNonQuery()|out-null 
    $SqlConnection.Close();
}

$names = GetServerName($computernamexml)
$pfcounters = GetAlterCounter($alter_xml)
foreach($cp in $names)
{
    $p = New-Object Collections.Generic.List[string]
    $report = ""
    foreach ($pfc in $pfcounters)
    {
        $b = ""
        $counter ="\\"+$cp+"\LogicalDisk("+$pfc.get_InnerText().Trim()+")\% Free Space"
        $p.Add($counter)        
    }    
    $count = Get-Counter $p
    #Write-Host $count.CounterSamples.Count;
    for ($i = 0; $i -lt $count.CounterSamples.Count; $i++)
    {
        $v = $count.CounterSamples.Get($i).CookedValue
        $pfc = $pfcounters[$i]
        #$pfc.get_InnerText()
        $b = ""
        $lg = ""
       if ($pfc.operator -eq "gt")
        {
            if( $v -le [double]$pfc.alter)
                {
                    $b = "alter"
                    $lg = "Less Than"
                }
                if($b -eq "alter")
                {
                    $path = "機器名:"+$cp+"; 盤符:"+$pfc.get_InnerText()
                    $diskFree="; 當前剩餘空間爲:"+[math]::truncate($v).ToString()+"G;"
                    $aler=" 超過了你預約的閥值:"+$pfc.alter.Trim()+"G;速度去處理吧!"            
                    $item = "{0} {1} {2}" -f $path,$diskFree,$aler
                    $report += $item + "`n"
                }
        }           
    }
    if($report -ne "")
    {
        #生產警告 參數 計數器,閥值,當前值
        CreateAlter $report
    }
}

經過如上腳本,生成跑批任務,就能夠自動的檢測磁盤剩餘空間了,而不須要咱們去手動檢測了。

上述代碼中,有兩個技術點:一、須要本身配置SQL Server郵件代理;二、須要本身配置跑批計劃,方法本身網上搜,很簡單。

效果圖以下

嘿...看到上面的郵件,就是須要聯繫硬件架構師,讓其擴容或者清除冗餘數據的時候了。

在上面的腳本中,的確只有個人F盤符超了閥值,因此警報了!

 

其次,咱們來解決第二個問題,關於SQL Server錯誤日誌的問題,做爲平常的DBA管理系統中,查看SQL Server錯誤日誌是一種經常使用的方式。固然,若是系統運行正常,不會產生錯誤日誌,一單出現問題,就會生成錯誤日誌,可是對於SQL Server錯誤日誌會產生不少條,爲了方便查找,咱們會讓其生成一個文本文件。

以郵件附件的形式,告知管理員,而後管理員就能夠經過日誌文件快速的定位問題的源頭。

一樣,本篇也是經過computername.xml文件,對多臺服務器進行錯誤日誌進行篩選

腳本很簡單,以下

$server = "(local)"
$uid = "sa"
$db="master"
$pwd="password"
$mailprfname = "TestMail"
$recipients = "787449667@qq.com"
$subject = "老大,快去看看這個服務器的SQL Server出問題了!"
$Info="附件爲SQL Server錯誤日誌....."
$computernamexml = "F:\PowerShell\發送郵件\computername.xml"
function GetServerName($xmlpath)
{
    $xml = [xml] (Get-Content $xmlpath)
    $return = New-Object Collections.Generic.List[string]
    for($i = 0;$i -lt $xml.computernames.ChildNodes.Count;$i++)
    {
        if ( $xml.computernames.ChildNodes.Count -eq 1)
        {
            $cp = [string]$xml.computernames.computername
        }
        else
        {
            $cp = [string]$xml.computernames.computername[$i]
        }
        $return.Add($cp.Trim())
    }
    $return
}

function GetAlterCounter($xmlpath)
{
    $xml = [xml] (Get-Content $xmlpath)
    $return = New-Object Collections.Generic.List[string]
    $list = $xml.counters.Counter
    $list
}

function CreateAlter($message)
{
    $SqlConnection = New-Object System.Data.SqlClient.SqlConnection 
    $CnnString ="Server = $server; Database = $db;User Id = $uid; Password = $pwd" 
    $SqlConnection.ConnectionString = $CnnString 
    $CC = $SqlConnection.CreateCommand(); 
    if (-not ($SqlConnection.State -like "Open")) { $SqlConnection.Open() } 
    
    $cc.CommandText=
            " EXEC msdb..sp_send_dbmail 
             @profile_name  = '$mailprfname'
            ,@recipients = '$recipients'
            ,@body = '$Info'
            ,@subject = '$subject'
            ,@file_attachments='$message'
            "
    $cc.ExecuteNonQuery()|out-null 
    $SqlConnection.Close();
}

$names = GetServerName($computernamexml)
foreach($cp in $names)
{
        #輸出系統日誌中某個特定程序的日誌到文件,好比SQL Server,而後選擇錯誤類型爲Error
        Get-EventLog -ComputerName  $cp application | where-object{$_.source-like "MSSQLSERVER"} | where-object{$_.entryType -eq "error"} >F:\PowerShell\$cp+"SQLErrLog.txt"
          
        #生產警告 參數 計數器,閥值,當前值
        CreateAlter F:\PowerShell\$cp+"SQLErrLog.txt"
}

效果圖以下

直接下載附件,而後查看錯誤日誌就能夠了。

該錯誤日誌仍是挺詳細的,發生時間,錯誤明細等

固然,上述腳本還欠缺一點邏輯:

好比:篩選一段時間週期的錯誤日誌、或者只查看上次啓動以後的錯誤日誌等。

這些邏輯加上也不麻煩,自己PowerShell實現起來就很簡單。這裏就不展開了,本身靈活實現。

 

可是,在咱們平常的分析中,在日誌記錄多的時候,用文本分析的方式仍是比較慢,一般用Excel查看效果會好不少。

這個實現也不麻煩,只須要更改腳本以下:

        #輸出系統日誌中某個特定程序的日誌到文件,好比SQL Server,而後選擇錯誤類型爲Error
        #Get-EventLog -ComputerName  $cp application | where-object{$_.source-like "MSSQLSERVER"} | where-object{$_.entryType -eq "error"} >F:\PowerShell\$cp+"SQLErrLog.txt"

        #輸出系統日誌中某個特定程序的日誌到文件,好比SQL Server,而後選擇錯誤類型爲Error,支持Excel打開
        Get-EventLog -ComputerName  $cp application | where-object{$_.source-like "MSSQLSERVER"} | where-object{$_.entryType -eq "error"} | Export-Clixml –Path F:\PowerShell\$cp+"SQLErrLog.xml" –Depth 2 
          
        #生產警告 參數 計數器,閥值,當前值
        CreateAlter F:\PowerShell\$cp+"SQLErrLog.xml"

咱們下載生成的日誌文件,而後打開Excel,而後選擇:數據——>從Xml文件導入:

如此分析就方便多了。

 

結語 

本篇就列舉了一下利用PowerShell實現自動化運維和檢測。算做拋磚引玉了吧,本身另有需求能夠本身靈活實現。

關於SQL Server自動化運維和檢測的內容很普遍,其中不少都是從平常的經驗中出發,一步步的從手動到自動的過程。

後面的文章,咱們將會更深刻關於SQL Server的自動化優化運維進行分析。有興趣的童鞋,能夠提早關注。

 

若是您看了本篇博客,以爲對您有所收穫,請不要吝嗇您的「推薦」。 

相關文章
相關標籤/搜索