吳亞聯 1 , 梁坤鑫 1 , 蘇永新 1* , 詹 俊 2
(1.湘潭大學 信息工程學院, 湖南 湘潭 411105; 2.湖南優利泰克自動化系統有限公司, 湖南 長沙 410205)前端
摘 要: 爲提升風電機組部件故障預警的精度和速度, 文章提出了一種基於SCADA數據的風電機組部件故障預警方法, 用於解決現存的風電機組部件故障預警時間與故障預警精度的矛盾。 首先SCADA歷史數據經過數據預處理與BP神經網絡創建機組部件正常狀態模型, 隨後以該模型爲基礎結合基於馬氏距離的數據統計方法造成故障預警判據, 並將結果反饋給SCADA系統達到風電機組部件故障預警目的。 仿真結果代表, 使用該方法可以提早2個月識別主軸承故障信號, 同時該方法能發現SCADA系統誤報故障。
關鍵詞: 神經網絡; 故障診斷系統; 馬氏距離; 風電場; SCADA系統算法
做爲一種綠色無污染的新能源, 風能愈來愈受到重視,它將成爲人類將來主要的能源資源 [1] 。 受複雜多變的環境因素影響, 風電機組各部件性能會在運行中逐漸降低, 最終致使部件發生故障。 而對風電機組部件進行故障預警則可提早發現隱患, 有利於優化維護計劃, 避免因部件故障延誤而致使更加嚴重的整機故障。
傳統風電機組故障預警方法有振動分析、 聲學分析、 潤滑分析等, 這些方法須要採集高頻率的振動數據或額外安裝高成本附加設備或者傳感器, 致使難以普遍應用於風場中。 風機數據採集與監控(Supervisory Control And Data Acquisition, SCADA) 系統做爲風機狀態監測的重要組成部分, 可以提供監測風機狀態與風機部件運行狀態的數據, 基於SCADA數據驅動的風機部件故障預警方法已經被普遍應用於風場中。 經過SCADA數據創建神經網絡模型對風機部件進行故障預警不須要對風機組件的機械結構有深刻了解。
當SCADA數據充足的狀況下, 可以實現對風機多部件的故障預警。 神經網絡對風機組件故障預警的這些優勢, 使其成爲風機關鍵部件故障預警的重要方法之一 [2-4] 。
Garcia等 [5] 在2006年提出經過利用神經網絡創建風機組件正常模型對風機齒輪箱進行故障預警, 該方法經過神經網絡正常模型的預測值與實際值進行比較獲得偏差, 將在正常行爲模型定義的置信區間以外的偏差判斷爲異常。 研究結果代表, 使用Garcia提出的方法只能提早26小時監測到風機齒輪箱發生故障, 預警時間太短致使沒法針對即將發生的故障制定相應的維護計劃。 Zaher等 [6] 在2009年提出相似的方法, 即經過觀察神經網絡的預測值與實時數據之間的偏差和偏差頻率的增長來實現故障預警。 該方法可以提早6個月對齒輪箱軸承故障進行識別, 可是由於缺少定量的判據來判斷風機組件是否發生異常, 不曾大量運用於風場。 Kusiak等 [7] 在2012年經過改進神經網絡模型, 選取最優性能模型對風機發電機軸承進行故障預測。 實驗結果代表, 該方法可以提升神經網絡精度, 但只能實現提早1.5小時對風機發電機軸承進行故障預測。 因爲預警時間太短, 風場業主短期內沒法制定有效的維護計劃。針對以上問題, 本文着力解決故障預警時間和預警精度的矛盾。 在結合逐步迴歸算法和遺傳算法優化神經網絡預測模型的基礎上, 根據神經網絡預測模型與馬氏距離原理, 提出基於SCADA數據的風機部件故障預警方法。 經過某風場2 MW直驅式的風機進行試驗、 分析, 驗證所給出的方法在預警時間、 精度方面的有效性。
1 風機故障預警框架
如引言所述, 本文提出一種基於遺傳算法的優化BP神經網絡(Genetic Algorithm-Back Propagation, GA-BP) 和風機部件參數機率分佈的風電機組部件故障預警方法, 其原理如圖1所示, 方法分爲風電機組部件正常行爲建模、 故障預警兩個部分。網絡
圖1 基於SCADA數據驅動的風電機組部件故障預警app
1.1 風電機組部件正常行爲建模
實際觀測中發現SCADA數據中存在異常數據, 爲保證訓練數據的一致性與連續性, 對訓練數據進行異常數據濾除。 同時爲了不輸入參數重複使用與數據冗餘, 採用逐步迴歸算法獲取神經網絡輸入參數, 獲取風機部件參數相關性較大的輸入參數。SCADA系統因爲結構複雜狀態參數衆多, 故障特徵與故障之間存在極爲複雜的非線性關係。 GA-BP神經網絡具備強大的非線性映射功能, 無需單獨建模, 能有效運用於風電場故障診斷中。 基於GA-BP神經網絡, 選取相關參數, 創建風電機組部件正常行爲模型, 正常行爲模型結合基於馬氏距離的數據統計方法, 造成故障預警判據, 計算了故障分佈機率, 能適應多重工況。
1.2 故障預警
經過SCADA系統將風電機組部件實時監控數據輸入模型, 獲得其輸出, 並計算其與正常值的馬氏距離, 若是馬氏距離越限, 則斷定機組故障, 從而實現故障預警。如圖1所示, 基於SCADA數據對風電機組部件進行故障預警主要分爲如下3個步驟: 神經網絡選擇; 數據預處理; 風機部件故障判據肯定。
1.3 神經網絡選擇
風機部件故障診斷問題本質上是非線性的, 選擇的神經網絡應具備並行處理學習記憶和非線性等特色。 針對以上特色, 選取BP神經網絡創建正常模型對風機部件進行故障診斷, 結果代表BP神經網絡在風機故障預警中的適用性 [7-8] 。結合具備全局尋優能力的遺傳算法, 優化BP神經網絡的權重和閾值, 設計基於GA-BP神經網絡, 構建風電機組部件預警方案, 有效改善了BP神經網絡速度和收斂速度, 也可提升故障預警的成功率 [8-9] 。 本文采用遺傳算法優化後的BP神經網絡。
2 數據預處理
2.1 異常數據濾除
神經網絡預測模型經過訓練階段的數據來肯定輸入輸出之間的映射, 然而SCADA數據在正常狀況下很難找到一個完整的、 正常的訓練數據集。 一般狀況下經過SCADA系統獲取的數據是不連續、 不一致的, 爲了提升神經網絡預測模型的準確性, 須要對數據進行預處理。選取風機功率數據進行數據預處理, 圖2爲某風機功率數據圖, 經過數據的平均值 x 和誤差δ, 對數據進行異常濾除, 受到其餘外部因素的影響致使數據具備波動性, 對其進行指數滑差處理:框架
式中: k經過統計小几率事件肯定, 經過設置k和α對數據進行異常判斷, 當x t 知足公式(2) 時, 能夠判斷當前數據爲正常值, 不然爲異常進行濾除。 選取k=3和α=0.3對功率數據進行處理, 濾除結果如圖2所示。ide
圖2 風電機組功率數據預處理函數
2.2 神經網絡輸入參數選擇
對於風電場的SCADA數據, 神經網絡選取輸入參數, 大多經過主觀經驗判斷或者參數之間的相關性來決定。 因爲風電場SCADA參數之間存在相關性, 使用參數相關性選取神經網絡輸入參數的方法, 當選擇輸入參數存在高度相關時, 會形成參數的重複使用和數據冗餘的問題。 而經過主觀經驗法選擇神經網絡輸入參數, 因爲影響風機部件的參數比較多, 存在選擇參數不許確, 致使神經網絡效率低, 選擇參數過少, 精度不夠等問題。咱們採起逐步迴歸 [10-11] 解決這一問題, 逐步迴歸分析具體步驟以下所示:
第一步: 輸入SCADA參數樣本X(m,n), 有n個參數x 1 ,x 2 ,x 3 ,…,x n , 全部參數的維度爲m。
第二步: 故障預警部件參數設爲x n 計算全部參數的平均值ix 、 離均差平方和s ii 、 協方差矩陣S=(s ij ) n×n' 和相關係數矩陣R=(r ij ) n×n' 。性能
其中i,j=1,2,3,…,n-1,n。
第三步: 判斷可選入參數個數是否大於2, 選入參數數量當大於2繼續下一步, 不然結束。
第四步: 計算各參數的方差貢獻, 以l(l≥1) 步爲例, 計算偏回歸平方和V l p 。學習
第五步: 選入參數的顯著性檢驗。 檢驗時, 先選定信度a, 查表獲得F a , 挑選未入選的模型中方差貢獻最大的參數,計算:測試
若F 1 >F a , 說明該參數對y做用顯著, 應該選入參數, 同時對相關係數矩陣R作變換, 不然結束。
第六步: 判斷選入參數的數量是否大於2, 當數量大於2則繼續下一步, 不然執行第四步。
第七步: 作剔除參數的顯著性檢驗。 挑選入選模型中方差貢獻最小的變量, 計算:
若F 2 <F a , 說明該變量對y做用不顯著, 應該剔除掉, 對相關係數矩陣R作變換。 不然將參數保留。 並執行下一步
第八步: 判斷爲剩餘可選入參數數量是否大於2個, 當知足大於2時, 執行第四步, 不然得到最優參數子集。
3 風機部件故障判據
針對上文中提出的傳統風機部件故障預警方法的侷限性, 本文經過馬氏距離設計風電機組部件故障判據, 馬氏距離方本質上是一種統計學方法, 避免了傳統上單次幅度閾值判斷方法受偶然因素影響劇烈的缺點。馬氏距離是一種距離測量單位, 表示數據協方差距離大小。 馬氏距離可以排除相關變量之間相關性的干擾, 給出多元變量中單變量的距離, 經常使用來識別數據集中的異常值。 由此本文使用該方法以獲取SCADA數據集中的異常值, 馬氏距離獲取數據異常值計算如式(10) 所示:
第i個向量X i =[Xi1, Xi2, Xi3,…, X im ], m是向量總數。u=[u 1 ,u 2 ,u 3 ,…,u m ]是均值向量。馬氏距離對於訓練數據集的計算以下:
式中: X ref =[訓練數據, 訓練偏差], 用於訓練神經網絡的歷史數據, 訓練數據所產生的偏差。經過獲取到的馬氏距離值利用最小二乘法肯定威布爾分佈函數:
在訓練階段獲取到的馬氏距離值符合雙函數威布爾分佈, 如圖3所示。 經過獲取到的馬氏距離值利用最小二乘法肯定威布爾分佈函數:
其中: X newi =[預測偏差, 測量數據], 其中測量數據指的是預測時SCADA監控到的組件的實時數據, 預測偏差指的是神經網絡的預測值與實時數據的偏差。
經過獲取到實時的預測偏差與檢測數據, 計算獲得馬氏距離值MD newi , 經過獲取到的馬氏距離值MD newi 計算f(MD newi ) 。 當知足f(MD newi ) <0.01時, 則能夠判斷當前數據爲異常 [12] 。 實現風機部件故障診斷。
圖3 人工神經網絡訓練過程MD值的
直方圖和韋布爾機率密度函數
4 仿真及結果分析
相比於傳統的風電機組須要齒輪箱的多級增速, 直驅式風電機組忽略了增益齒輪箱, 結構較爲簡單。 可是因爲風輪和發電機的整個重量做用在主軸承上, 一旦主軸承發生故障, 若不能及時處理, 將致使更爲嚴重的風電機組整機故障。 本文基於Matlab 2016a平臺對直驅式風電機組關鍵部件主軸承的故障預警進行上述方法試驗分析。
4.1 神經網絡型輸入參數選擇
SCADA系統主要監測主軸承運行時的溫度, 選取SCADA系統參數主軸承溫度2(前端) 做爲因變量, 其餘參數爲自變量, 如圖4所示, 使用SPSS軟件進行逐步迴歸分析,得到主軸承溫度2正常模型輸入參數。
圖4 模型輸入輸出參數
4.2 異常數據濾除
根據第2節所提到的方法對主軸承溫度2數據進行預處理。 如圖4所示選取輸入參數爲自變量對主軸承溫度2分別進行異常數據濾除, 同時當主軸承溫度2處於異常時, 濾除對應全部輸入參數數據。 如圖5所示, 當主軸承溫度2處於異常狀態時, 濾除對應的輸入參數如風速、 輪廓轉速、 機艙溫度等數據。 將濾除後的數據用於神經網絡訓練和測試。
4.3 主軸承故障診斷
本文經過兩臺直驅式風機主軸承故障診斷仿真試驗, 驗證上述故障預警方法的有效性, 並與其餘傳統風機部件故障預警方法進行比較。神經網絡訓練階段原始SCADA數據具備較大的波動性, 爲了下降波動性, 對數據進行10 min平均標準化處理。在24 h內可獲取144個測量值, 進行故障診斷的馬氏距離值根據經驗法應當選取12 h平均, 每24 h生成2個馬氏距離值。
圖5 風電機組主軸承溫度2異常數據濾除
4.3.1 風機P01主軸承發生故障
風電場SCADA系統經過簡單設置主軸承溫度閾值的方法來對主軸承溫度進行狀態監測, 當主軸承溫度高於設定的閾值時SCADA就會向風場業主發出報警。使用本文方法結合SCADA數據對風機P01在2016年1月到2017年1月進行主軸承故障診斷, 結果如圖6所示。 由圖可得SCADA系統第一次發出警報的時間在5月份, 隨着時間的推移, SCADA系統報警的次數隨之增長, 最終業主進行維護, 主軸承故障消失, SCADA系統報警中止。
圖6 P01主軸承故障監測結果
相比於SCADA報警方法, 使用本文方法在3月份時馬氏距離值已經超出了故障閾值從而獲得第一次報警。 隨着時間的增長, SCADA系統在5月份開始報警, 相比於SCADA系統狀態監測的方法, 使用本文方法可以提早2個月對風機主軸承進行故障報警。爲了不本文方法因爲神經網絡輸入參數值異常, 致使馬氏距離值超出閾值產生故障報警。 如圖7所示, 對神經網絡輸入參數進行分析, 圖7中的最大值和最小值分別對應的是訓練數據中的最大值和最小值, 能夠觀察到在圖7中, 輸入正常模型的參數在訓練神經網絡數據的範圍內, 輸入參數值並未產生異常。 所以能夠判斷使用本文方法檢測到的異常爲組件狀態異常。
圖7 P01主軸承故障監測輸入數據
在同一時間內獲取風機P01神經網絡預測偏差值如圖8所示。 由圖七、 圖9可得當偏差閾值絕對值設定在1.5時,預測偏差並無超過該閾值, 並未能產生報警。 驗證了本文方法優於傳統利用預測偏差進行風機部件進行故障預警的方法。
圖8 P01主軸承預測偏差
圖9 P07主軸承故障監測結果
4.3.2 風機P07SCADA系統誤報警
使用本文方法對相同型號風機P07在2016年1月到2017年1月進行主軸承故障診斷, 結果如圖9所示。由圖9可知, 該風機SCADA系統在1月出現第一次報警,隨着時間的增長SCADA系統報警數量增長。 而根據本文方法, 馬氏距離的值全程均不曾超過閾值, 能夠獲得主軸承沒有發生故障的結論, 與事實相符。 可見咱們提出的方法, 還能輔助風場業主分辨現有SCADA系統報警是否有效, 有利於風場業主制定有效的維護計劃。
5 結語
對風電機組關鍵部件進行故障預警的關鍵是預警準確、 及時。 本文以神經網絡在風電機組部件故障預警的應用爲背景, 着力解決故障預警時間和預警精度的矛盾, 提出了一種SCADA數據驅動的風電機組部件故障預警方法。
(1) 方法結合逐步迴歸算法與指數滑差算法, 給出SCADA數據預處理方法, 準確找出對風電機組影響較大參數, 並濾除這些參數的噪聲。
(2) 方法經過神經網絡預測模型與馬氏距離算法, 將傳統故障預警方法改成統計方法, 而且這種統計方法計算了故障分佈機率, 可以適應運行工況複雜多變狀況。
(3) 以兩臺2 MW直驅式風機爲對象, 對本文方法進行實例驗證。 試驗結果代表: 使用該方法可以提早2個月識別主軸承故障信號, 同時該方法能發現SCADA系統誤報故障。 本方案能有效贏得備件和維護計劃優化時間, 也能剔除SCADA系統誤報下降維護量, 有效下降風電場維護成本。下一步將根據風機內部零部件之間的相關性, 針對風機整機研究風電機組整機故障預警方法。
[參考文獻][1]GWEC.Global wind energy outlook 2016 available online[EB/OL].(2016-04-04) [2018-05-08].http://www.gwec.net.[2]郭清, 夏虹, 韓文偉.基於小波熵與BP神經網絡的電機故障信號研究[J].儀表技術與傳感器, 2014(1): 96-99.[3]範文, 孫冬梅, 熊鑫, 等.基於信息融合技術的磁軸承轉子故障診斷[J].儀表技術與傳感器, 2015(12): 136-140.[4]張偉, 鄭恩讓.基於多層前向神經網絡的應力傳感器故障診斷[J].儀表技術與傳感器, 2001(4): 1-2.[5]GARCIA M C, SANZ-BOBI M A, DEL PICO J.SIMAP: intelligent system for predictive maintenance: application to the health condition monitoring of a windturbine gearbox[J].Computers in Industry, 2006(6): 552-568.[6]ZAHER A, MCARTHUR S D J, INFIELD D G, et al.Online wind turbine fault detection through automated SCADA data analysis[J]. Wind Energy, 2009(6): 574-593.[7]KUSIAK A, VERMA A.Analyzing bearing faults in wind turbines: a data-mining approach[J].Renewable Energy, 2012(48): 110-116.[8]SUN P, LI J, WANG C, et al.A generalized model for wind turbine anomaly identifcation based on SCADA data[J].Applied Energy,2016(168): 550-567.[9]郭東傑, 王靈梅, 郭紅龍, 等.改進小波結合BP網絡的風力發電機故障診斷[J].電力系統及其自動化學報, 2012(2): 53-58.[10]ZHANG Z Y, WANG K S.Wind turbine fault detection based on SCADA data analysis using ANN[J].Advances in Manu Facturing,2014(1): 70-78.[11]高興良.基於逐步迴歸分析的組合神經網絡股指預測研究[D].哈爾濱: 哈爾濱工業大學, 2015.[12]BANGALORE P, LETZGUS S, KARLSSON D, et al.An artificial neural network‐ based condition monitoring method for wind turbines, with application to the monitoring of the gearbox[J].Wind Energy, 2017(8): 1421-1438.