什麼是大數據?初步認識大數據(2)

企業數據資產

  有了大數據的光環,有了從數據中挖掘商業價值的方法和工具以後,那些本來存放在服務器上平淡無奇的陳年舊數一晚上之間身價倍增。按照世界經濟論壇報告的見解,「大數據爲新財富,價值堪比石油"。《大數據時代》一書的做者維克托則樂觀地預測,數據列人企業資產負債表只是時間問題。算法

  本質上,任何企業在生產活動中都會產生數據,數據都有分析的價值。咱們來看看典型的運營商會產生哪些數據安全

  圖1.2是典型的運營商產生的數據,從下到上分爲以下幾類。服務器

  Network Raw Data:電信網絡裏任何一個呼叫或者上網行爲都會引發電信設備之間的數據進行交換,這個數據就是網絡底數據。網絡

  User Plane Detail Record Data:從網絡原始數據裏面提取出來的用戶行爲數據,如打電話數據、上網行爲等。工具

  MR/CHR Type Data:無線測量數據、呼叫歷史記錄單據數據。用戶的位置信息就是從MR/CHR 數據裏面經過算法得出的。性能

  Signaling Data:信令數據。電信網絡分控制面、數據面、用戶面。在控制面上設備之間相互按照協議協商通訊的數據叫信令數據。大數據

  CRM Billing:電信設備廠商登記的開戶信息、帳單信息。網站

  上面的劃分是從很是專業化的角度進行的,其實通俗一點能夠簡單歸類爲設備數據和用戶數據兩類。設備數據用來分析設備的正常與否,用於設備的維護、規劃等。用戶數據包括以下數據。加密

  位置數據:無線是用一個個蜂窩來劃分區域的,一個蜂窩叫一個小區,因此只要電話在線,就須要註冊到一個個小區中去,知道了小區就知道了用戶所在的位置。經過小區切換就能計算出用戶移動的軌跡,這就是用戶的位置數據blog

  上網數據:用戶經過運營商的設備上網,全部的行爲數據均可以被記錄下來,如上了什麼網站、網速是多少、上了多長時間。這些經過通訊協議的包頭就能夠獲取。若是繼續分析內容,就能夠獲取更多的數據,就能夠徹底知道用戶在幹什麼。

 

Note . In a typical network Of、30M subscribers and the data flow around IT引S.

MR℃HR Measurement Repott/CaIl History Data generated during calls

圖1.2

  用戶興趣數據:經過用戶的上網記錄,就能夠衍生出用戶的興趣愛好、常上什麼網站、最近關注什麼東西等。

  通訊數據和社交數據:例如,用戶給誰打了電話、打了多長時間、給誰發了短信,這些信息均可以被記錄下來。經過電話聯繫又能夠衍生出用戶的社交關係數據,如和誰是熟人、常聯繫誰等。

  身份信息數據:用戶到運營商開戶,用戶的全部我的信息就被運營商記錄下來,包括姓名、年齡、身份證號碼等。並且這些數據是由人工採集的,準確度遠高於互聯網用戶本身註冊的。

  用戶金融數據:如用戶的電話、網絡繳費記錄,是否常常欠費等,可用於進行我的信用分析。

由此能夠看出,運營商擁有從底層的設備數據到上層用戶的行爲數據,並且一般是全網的數據,所以能夠說抱着數據的「金礦",是其餘廠商所沒法媲美的。

大數據挑戰

  大數據發展到如今,有了必定的技術和商業積累,可是還有不少難題等待解答,最典型的就是成本、實時性、安全等方面的挑戰。

成本挑戰

  運營商廣泛受到騰訊、阿里巴巴等互聯網廠商的OTT應用的擠壓,面臨着管道轉型、利潤降低的風險。而運營商的數據量巨大,以PB爲基本單位的數據,處理起來須要巨大的投人。外部商業環境和內部規模的雙重擠壓,對大數據平臺提出了很高的性能和成本要求。

實時性挑戰

  若是從廣義的數據質量角度看,隨着時間的推移,數據的價值將逐漸下降,時間越久的數據,價值越低。舉個例子,一家商場須要對當前在商場內的客戶作一個推薦活動。可是端到端採集和處理數據的時間過長,最後推薦平臺獲得的用戶列表都是過時的列表,列表上的名單可能已經不在商場內,而新到的用戶尚未更新到名單中來,因此不少業務對大數據平臺端到端的實時性提出了很高的要求。

安全挑戰

安全挑戰體如今兩個方面:

  一方面是在技術上,隨着HTTPS的推廣應用,數據在傳輸過程當中採用管理加密的方式,運營商做爲管道獲取數據的難度變得愈來愈大。

  另外一方面是在法理上,用戶的哪些數據是能夠獲取的、哪些是不容許讀取的,始終存在侵犯用戶隱私的法律風險 。

相關文章
相關標籤/搜索