基於數據挖掘SVM模型的pre-incident事故預防預測分析報告

原文連接   http://tecdat.cn/?p=1614

In order to solve the problem of safety accidents in production and life, we can use the current rapid development of DM (Data Mining) technology to realize the accident prediction of the monitoring system through the multi-dimensional analysis of the accident information, improve the performance of the monitoring system and form the safety warning mechanism.

Accident prediction requires meaningful and reliable information, and a large number of raw information flows must be analyzed and processed during the crisis.

Based on the above background, tecdat researchers focus on the collection of accident information data and analyze the relevant information, through the time, place, semantic and other different dimensions of the analysis of valuable information, and try to machine learning method to predict the occurrence of the accident.

▍時間維度事故分析

經過時間維度(日期和時間)的事故分析,咱們能夠洞察到不一樣類型的事故發生的高峯時間和高發月份,從而進行有效預防。

經過對結果的可視化,能夠發現不一樣時間和月份的事故發生率有必定的差別,所以在後續的預測模型中能夠構建相應的時間僞變量從而提升精度。

▍不一樣事故類型

經過對全部事故數據類型的佔比分析,咱們能夠發現出行的事故發生率是最高的,也遠遠高於其餘類型,其次是觸電事故等。(注:部分事故重屬多個類型)

▍事故報告語義分析

經過對事故報告的語義分析,咱們能夠發現報告中頻繁出現的關鍵詞,從中洞察到某類事故發生後一般會關聯到哪些關鍵詞,分析其背後的緣由,從而進行有效的預防。

▍安全事故預測模型

在得到事故的不一樣維度基本特徵以後,咱們經過SVM算法使用這些特徵來預測不一樣類型的事故發生的可能性,採起有針對性的措施,避免未知事故發生帶來的損失,達到補救的效果。

▍技術

SVM(Support Vector Machine)用於構建、驗證和測試數據集的模型。

在Spark / MLLib / Scikit-Learn / HDFS中重構實現處理較大的數據集。

▍結果

模型預測精度精度達到82.5%。

相關文章
相關標籤/搜索