IEEE 2012 PHM數據挑戰賽

Sutrisno E, Oh H, Vasan A S S, et al. Estimation of remaining useful life of ball bearings using data driven methodologies[C]// Prognostics and Health Management. IEEE, 2012:1-7.算法

IEEE 2012 PHM數據挑戰賽比賽的目標是在實驗負荷條件下提供滾珠軸承剩餘使用壽命的最佳估計。實驗數據集由FEMTO-ST研究所提供。數據集涉及三種不一樣的負載條件。 條件1有七個滾珠軸承轉速爲1800轉/分鐘,徑向負荷爲4000N。 七個軸承中有兩個軸承提供了用於算法訓練的從開始運行至故障的完整數據,併爲其餘五個軸承提供了用於算法測試的截斷數據。 條件2的特色是七個滾珠軸承以1650轉/分鐘的轉速運行,徑向載荷爲4200N。 在7個軸承中,提供了兩個用於訓練的從開始運行至故障的完整數據,併爲五個軸承提供了測試數據。 條件3的特色是三個軸承以1500轉/分鐘,徑向載荷5000N運行。提供了兩個軸承的數據用於訓練,另有一個軸承的數據用於測試。函數

在軸承箱上安裝兩個加速度計,用於測量垂直和水平方向的振動。數據採樣間隔爲10秒,採樣率爲25.6 kHz,持續時間爲0.1 s; 所以,每一個觀察值包含2560點。測試

1.1 軸承的剩餘使用壽命估計方法spa

1.1.1 方法1:譜峯度和馬爾可夫蒙特卡羅法3d

圖1:六個軸承訓練數據的平均移動峯度譜:經過頻率範圍爲5.5至6.0 kHz的帶通濾波blog

 

利用spearman相關係數評估峯度和實驗持續時間之間的相關性,當兩個變量徹底單調遞增時,斯皮爾曼相關係數爲+1;兩個變量徹底單調遞減時,斯皮爾曼相關係數則爲−1。rem

 

經過spearman相關係數評估認爲振動信號的譜峯度被認爲是最具備隨時間增長而單調遞增特性的特徵,在比較了三種類型的退化信號模型與軸承的MAS峯度的擬合結果後,選擇指數模型io

對軸承譜峯度的退化數據進行擬合,其中a和b是模型常數,y是退化信號的大小,t是時間。表I顯示了指數模型的擬合程度class

 

指數模型a和b的常數使用馬爾可夫蒙特卡羅方法(MCMC)進行更新,馬爾可夫蒙特卡羅是一種經過在機率空間中隨機採樣來接近感興趣參數的後驗分佈的方法。每一個測試軸承的剩餘使用壽命經過指數模型預測MAS峯度的幅度超過預約義閾值的時刻來估計。 在實驗中,基於對圖1所示的六個訓練軸承的峯度的觀察,將故障閾值設定爲4。變量

 

圖2:利用MAS峯度和貝葉斯蒙特卡羅方法估計剩餘使用壽命:軸承2_5

 

圖2顯示了測試軸承2_5的故障時間預測直方圖。 估計在20,000秒的方位2_5的剩餘使用壽命(RUL)爲3,580秒。 軸承2_5的實際剩餘壽命爲3090秒。 測試軸承2_5的估算剩餘壽命和真正剩餘壽命之間的偏差爲-15.9%。 錯誤中的負值意味着軸承的剩餘使用壽命被高估了。偏差計算公式:

 

 

1.1.2 方法2:支持向量迴歸機模型

本方法使用最小二乘支持向量迴歸機的方法估計軸承的剩餘使用壽命(RUL)。其具體步驟以下圖所示

圖3:支持向量迴歸機模型預測過程

 

從軸承中測量獲得的垂直和水平方向的振動數據中提取特徵,每一個垂直或水平信號提取十七個特徵,共三十四個特徵,使用移動平均濾波器對其進行平滑以抑制測量中的噪聲。 在平滑以後對數據進行規範化處理,由此減少大動態範圍的特徵而致使的誤差。利用主成分分析法對數據進行降維處理,在減小須要分析的指標同時,儘可能減小原指標包含信息的損失,將PCA應用於從訓練軸承提取的特徵集,前三個主成分佔數據可變性的99.5%以上。 所以,咱們將特徵集從34個特徵減小到3個主要份量。 圖4示出了軸承2_2的前三個主要份量的時間序列圖。

 

圖4:平滑和歸一化後軸承2_2的前3個主要成分時間序列圖

將訓練集的三個主要成分做爲最小二乘支持向量機的輸入,軸承的剩餘使用壽命做爲目標

圖5:LS-SVR進行剩餘使用壽命估計說明

 

在預測模式下,從振動信號中提取測試軸承特徵,而且利用在訓練模式期間得到的變換矩陣計算相應的三個主要份量。將獲得的三個主要成分做爲輸入給訓練的LS-SVR,以產生剩餘使用壽命的估計值。

 

 

1.1.3 方法3:振動頻率特徵異常檢測和存活時間比

本方法利用異常檢測,退化特徵推斷和生存時間比估計測試軸承剩餘使用壽命(RUL)。

利用快速傅里葉變換生成對應頻譜,當頻譜中的峯值振動的頻率發生變化時,認爲檢測到異常,軸承頻率特徵變化的物理解釋是軸承內裂紋,剝落或其餘表面缺陷的發生,致使軸承結構以新的頻率和模式進行振動。

 

左上方圖爲軸承1_1的水平特徵圖。在#1218處觀察到水平特徵逐漸增長,檢測爲異常,此時軸承進入第一個異常區域。在#2747處軸承進入第二個異常區域。測試軸承1_3與軸承1_1的退化趨勢類似,利用指數曲線對軸承1_1的第一次異常數據進行擬合,第一次異常結束時的擬合值除以異常開始檢測值獲得5.47。經過軸承1_3的頻譜數據可知(左下角圖),在#822處水平方向最初存在於2500Hz附近的頻率消失,#822處的異常檢測被認爲是第一個異常區域的開始,經過#822處的水平特徵值乘以先前得到的5.47因子獲得閾值5.99,經過曲線擬合預測水平特徵在#2115處達到此閾值。

對軸承1_1來講,第一次異常區域是從#1218到#2747。經過2747減去1218,咱們得到了異常1的持續時間爲1529個觀測值,圖上的每一個觀察值之間的間隔爲10秒,即15,290秒。軸承1_1進入第二個異常區域560秒後失效。 第二次異常持續時間除以第一次異常持續時間比率:

 

對於軸承1_3來講,#822處被認爲是第一次異常區域的開始。 經過曲線擬合預測在#2115處爲第一次異常區域的結束,則第一次異常的持續時間爲1293個觀測值,即12,930秒。經過將異常1的持續時間乘以從方位1_1得到的異常比來估計異常2的持續時間

 

經過將兩個異常持續時間加在一塊兒來計算從第一次異常檢測開始到失效的時間:

 

因爲軸承1_3在實驗中存活了9800秒,所以軸承1_3的RUL估計爲:

 

根據比賽組織者提供的實際RUL數據,方法3估計軸承的剩餘使用壽命實際偏差以下圖所示

 

 

 

 

1.2 RUL估計方法的比較

上述三種方法使用了軸承退化的不一樣特徵來估計其剩餘使用壽命。

在方法1中,振動信號的譜峯度被認爲是具備隨時間增長而單調遞增的特徵。利用貝葉斯蒙特卡洛方法對指數模型的係數進行更新,但在軸承臨近失效時間點,其特徵會發生劇烈的改變。利用貝葉斯蒙特卡洛方法進行模型係數的更新未考慮這種狀況,有高估RUL的趨勢。

方法2,引入了支持向量迴歸機模型,對輸入特徵沒有單調趨勢的要求。 但因爲六個訓練軸承在失效時間前特徵變化劇烈,且訓練樣本有限,LSSVR高估了部分測試軸承的RUL。若是在每種條件下提供更多的訓練軸承,則算法精度能以更高的精度執行。

方法3,將軸承的退化分爲了多個階段,RUL的估算是基於對軸承退化階段之間的持續時間比值而進行預測,本方法其優勢在於RUL估計過程簡單,計算複雜度小。但其缺點是經過分析頻率特徵的變化來檢測異常,但在某些軸承中,頻率可能不發生變化或頻率中有噪聲,異常不能清楚地被識別。

以上提出了三種估算軸承剩餘使用壽命的方法。有限的訓練數據使得三種方法都具備高度的不肯定性,比賽根據評分函數計算每一個軸承的剩餘壽命估計得分,取全部軸承得分的平均值爲最終結果,最終第三種方法得到了2012年PHM數據挑戰賽優勝。

 

圖7:根據預測值與實際值的百分比偏差估算RUL的評分函數

相關文章
相關標籤/搜索