2015年,國務院頒佈了大數據實施綱要通知《國務院關於印發促進大數據發展行動綱要的通知》,從國家層面上將大數據戰略思想逐漸成型。隨之,各行各業逐漸意識到海量數據的價值及重要性,分析數據並挖掘其潛在價值的需求不斷加大。那麼咱們今天就來扒一扒:大數據能產生什麼價值,值得咱們去分析它?算法
1、什麼是大數據數據庫
IDC以4V特徵來定義大數據,即海量的數據規模(Volume)、快速的數據流轉和動態的數據體系(Velocity)、多樣的數據類型(Variety)、巨大的數據價值(Value);Amazon的John Rauser 將大數據定義爲:任何超過了一臺計算機處理能力的數據量。可見不一樣的主體對大數據的定義是不一樣,但有一個共同點,即數據必須是海量的。安全
一我的天天能夠產生以下社保信息:身份、醫保/養老/工傷/失業/生育等各險種的參保信息、財務、薪酬等敏感信息…….服務器
一臺工業設備天天能夠產生的信息:第1、行爲日誌。訪問信息、發送的控制指令等信息;第2、設備通訊日誌。包括數據鏈接創建時間、鏈接端口、訪問外部節點信息、傳輸數據量等信息;第3、設備異常報警日誌。如設備認證失敗、異常行爲類型等;第4、流量信息及阻斷信息。網絡
這些信息天天都在產生,長此以往匯聚成海量的數據,經過不一樣的終端以各類各樣的形式存在。好比,存儲於關係型數據庫Oracle、PostgreSQL,數據文件XML,Hadoop數據源HDFS等。可是它們的價值密度較低,海量數據中只有小部分是有用的,其餘大部分數據沒有什麼價值,必須進行分析才能發現價值。架構
2、大數據的價值oop
下面咱們就從社保大數據和工業設備大數據這兩個領域,來看看分析這些大數據能產生什麼價值?大數據
(一)分析社保大數據產生的價值設計
通過近三十年的發展,我國社會保險制度逐步趨於完善,社會保險覆蓋範圍不斷擴大,社會保險基金徵繳和管理不斷增強,各項社會保險待遇水平進一步提升。與此同時,伴隨着信息技術的進步,金保工程的實施,一個以信息網絡三級互聯、應用軟件基本統1、數據資源集中管理爲主要特徵的、統一的金保工程支撐平臺已在全國基本造成,全國全部地級城市和省級人社部門均已創建了數據中心,32個省級單位所有實現了與部中央數據中心的網絡聯結,90%以上的地市實現了與省級數據中心的聯網,城域網已經聯接到92.5%的社會保險經辦機構和就業服務機構,而且延伸到街道、社區、鄉鎮和定點醫療服務機構,覆蓋全國的人力資源社會保障信息網絡架構初具規模。社保數據不斷向上集中,參保人數幾乎覆蓋全國,歷史數據不斷積累,社會保障信息呈現出「大數據」的特性。日誌
大數據系統能夠將社保全部的經辦點和服務機構聯結起來,實現跨區域、跨險種社保數據的整合後進行分析,從而解決以下問題:
第一,能夠防止如下冒領社保待遇的行爲。防止居住本地但不具有在本市辦理退休的外地參保人員,採起僞造轉移信息表,虛構繳費年限,騙取社會保險關係轉移接續的;防止參保人員與中介(或用人單位)虛構勞動關係,提供虛假證實材料,按照單位職工突發重大疾病特殊審批政策規定騙取醫療保險待遇;防止單位爲自願離崗的職工出具解除職工勞動關係證實,騙取失業保險待遇享受資格的;防止非工傷人員虛構、僞造受傷事實,騙取工傷保險待遇;防止工傷人員虛構、僞造、變造、非法更改工傷認定、勞動能力鑑定原始結論,隱瞞、編造病史騙取工傷保險待遇;防止工亡職工供養親屬虛構、僞造、變造、非法更改原始證實材料騙取供養親屬撫卹金待遇的。
第二,能夠防止如下重複參保的行爲。防止參保退休人員經過重複參保繳費,重複領取養老待遇;防止離退休人員死亡後,親屬不告知社會保險經辦機構繼續冒領養老金;防止享受失業保險待遇期間已從新就業,蓄意欺騙社會保險經辦機構並繼續享受失業保險待遇;防止享受失業保險待遇期間人員已經死亡或異地退休,不告知失業保險經辦機構並繼續享受失業保險待遇;防止享受工傷保險待遇的工傷人員、工亡職工供養親屬死亡後,親屬或所在單位不告知經辦機構繼續冒領工傷保險待遇。
第三,有利於社保基金的監管。社保基金安全有效運營和在動態經濟環境中保值增值,是社保的關鍵所在。基於這樣的認識,運用數據挖掘算法,在對社會保險基金運行情況進行統計分析的基礎上,經過設計監測預警模型,肯定預警線及警惕標誌來進行社保基金的事前監管。改變以往過後審計、事中監督的監管模式,不只有利於防止實踐中社保基金被挪用、侵佔現象屢禁不止,違規操做的事件層出不窮,威脅到保障廣大勞動者切實利益的「養命錢」和「保命錢」安全的弊端。並且,有助於進一步規範和完善監管制度,加強基金投資和運營狀況的透明度,創建信息化的基金監管體系。從而充分發揮社會保障制度的「減震器」、「安全網」做用和對經濟持續增加的「助推器」功能。對於構建和諧社會和保持經濟結構調整、經濟體制轉型時期的社會穩定具備積極的意義。
(二)分析工業設備大數據產生的價值
根據統計,大多數據的涉密犯罪來自於內部:應用單位未設立相應的安全管理系統、技術措施和制度。不少安全事故基本是由於內部人員和外部人員勾結所爲,並且呈上升的趨勢。由於內部人員比外部人員更加容易得到系統的權限,可以形成更大的威脅,而通常的安全防禦系統對外部的防範比較多,而內部的防範和監控相對比較薄弱,形成內部人員的不合法操做很難被發現,具備威脅大、難防護、難發現的特色。
經過大數據分析,除能經過系統報警和統計發現違規操做行爲和頻次這些基礎功能外,還能保證設備的深度安全運行,以及對內部人員的高危操做進行捕捉。
第一,保證設備的深度安全運行。能夠直接利用工業控制網絡中的隔離設備做爲日誌採集探針,將其採集的上位機、下位機、設備、主機和應用系統日誌進行全面的標準化處理,及時發現各類安全威脅、異常行爲事件,透過事件的表象真實地還原事件背後的信息,提供真正可信賴的事件追責依據和業務運行的深度安全。
第二,對內部人員的高危操做進行捕捉。輕鬆實現挖掘線索,追溯、定位到人,對犯罪行爲起到足夠的震懾,幫助工控企業最大程度規避內部人員違規操做的風險。強有力的防止內部人員濫用權利 進行計算機犯罪,或者把特權轉讓給有惡意目的的用戶,從其服務器中盜取重要生產控制數據。