基於Spark技術實現大規模時間序列異常檢測成功落地

最近一直忙於異常檢測項目的上線,一直沒有時間來更新博客,該系統已經在大規模時間序列場景穩定運行1個多月,簡單總結一下。java 達到的目標,經過Spark對3萬個服務器進行預測,每一個服務器包括5個指標,每一個指標對應一個時間序列,模型全量15萬,全量訓練用21個Core耗時3個小時,預測程序12個core運行狀態良好,整個系統已經平穩運行一個月,整個系統預估可以支持上億個模型進行同時訓練和預測。
相關文章
相關標籤/搜索