大數據基礎概論

1、大數據概念數據庫

  1.大數據的定義:網絡

    指沒法在必定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是須要新處理模式才能具備更強的決策力、洞察發現力和流程優化能力的海量、高增加率和多樣化的信息資產。補充:主要解決,海量數據的存儲和海量數據的分析計算問題。機器學習

  2.數據的單位:工具

    bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。學習

    1Byte = 8bit 1K = 1024Byte 1MB = 1024K 1G = 1024M 1T = 1024G 1P = 1024T。。。大數據

2、大數據特色優化

  1.Volume(大量):人工智能

    截至目前,人類生產的全部印刷材料的數據量是200PB,而歷史上全人類總共說過的話的數據量大約是5EB。當前,典型我的計算機硬盤的容量爲TB量級,而一些大企業的數據量已經接近EB量級。spa

  2.Velocity(高速):日誌

    這是大數據區分於傳統數據挖掘的最顯著特徵。根據IDC(互聯網數據中心)的「數字宇宙」的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。例如:天貓雙十一交易額、保險行業開門紅。

  3.Variety(多樣):

    這種類型的多樣性也讓數據被分爲結構化數據和非結構化數據。相對於以往便於存儲的以數據庫/文本爲主的結構化數據,非結構化數據愈來愈多,包括網絡日誌、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。

  4.Value(低價值密度):

    價值密度的高低與數據總量的大小成反比。好比,在一週的交通監控視頻中,咱們只關心出事故的那一時間,如何快速對有價值數據「提純」成爲目前大數據背景下待解決的難題。

3、大數據能幹什麼

  1.O2O:

    百度大數據+平臺經過先進的線上線下打通技術和客流分析能力,助力商家精細化運營,提高銷量。

  2.零售:

    探索用戶價值,提供個性化服務解決方案;貫穿網絡與實體零售,攜手創造極致體驗。經典案例,紙尿布+啤酒。

  3.旅遊:

    深度結合大數據能力與旅遊行業需求,共建旅遊產業智慧管理、智慧服務和智慧營銷的將來。

  4.商品廣告推薦:

    商品廣告推薦:給用戶推薦訪問過的商品廣告類型。例如:天貓、京東等。

  5.保險:

    海量數據挖掘及風險預測,助力保險行業精準營銷,提高精細化訂價能力。

  6.金融:

    多維度體現用戶特徵,幫助金融機構推薦優質客戶,防範欺詐風險。

  7.房產:

    大數據全面助力房地產行業,打造精準投策與營銷,選出更合適的地,建造更合適的樓,賣給更合適的人。

  8.移動互聯網:

    根據用戶年齡、職業、消費狀況,分析統計哪一種套餐適合哪類人羣。對市場人羣精準定製。

  9.人工智能:

    人工智能依靠海量數據做爲支撐,機器學習等都須要海量數據進行訓練。

4、大數據的發展前景

  1.跟着國家走:

    黨的十八屆五中全會提出「實施國家大數據戰略」,國務院印發《促進大數據發展行動綱要》,大數據技術和應用處於創新突破期,國內市場需求處於爆發期,我國大數據產業面臨重要的發展機遇。

  2.跟着大學走:

    2017年北京大學、中國人民大學、北京郵電大學等25所高校成功申請開設大數據課程。

  3.跟着錢走:

    薪資高、缺口大。

5、大數據技術的生態體系

  待補充

相關文章
相關標籤/搜索