![](http://static.javashuo.com/static/loading.gif)
![](http://static.javashuo.com/static/loading.gif)
指沒法在必定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是須要新處理模式才能具備更強的決策力、洞察發現力,和流程優化能力的海量、高增加率和多樣化的信息資產。主要解決海量數據的存儲和海量數據的分析計算問題。html
大數據有4個特色,分別爲:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),通常咱們稱之爲4V。java
大量。大數據的特徵首先就體現爲「大」,隨着信息技術的高速發展,數據開始爆發性增加。存儲單位從過去的GB到TB,乃至如今的PB、EB級別,迫切須要智能的算法、強大的數據處理平臺和新的數據處理技術,來統計、分析、預測和實時處理如此大規模的數據。web
多樣。普遍的數據來源,不少平臺都會經過對用戶的日誌數據進行分析,從而進一步推薦用戶喜歡的東西。日誌數據是結構化明顯的數據,還有一些數據結構化不明顯,例如圖片、音頻、視頻等,這些數據因果關係弱,就須要人工對其進行標註。應用最普遍的就是推薦系統
算法
高速。大數據的產生很是迅速,主要經過互聯網傳輸。生活中每一個人都離不開互聯網,也就是說天天我的天天都在向大數據提供大量的資料。服務器中大量的資源都用於處理和計算數據,不少平臺都須要作到實時分析。數據無時無刻不在產生,誰的速度更快,誰就有優點。
服務器
價值。這也是大數據的核心特徵。大數據最大的價值在於經過從大量不相關的各類類型的數據中,挖掘出對將來趨勢與模式預測分析有價值的數據,並經過機器學習方法、人工智能方法或數據挖掘方法深度分析,發現新規律和新知識,並運用於農業、金融、醫療等各個領域,從而最終達到改善社會治理、提升生產效率、推動科學研究的效果。
微信
有人說北京畢竟是一線城市,那咱們來看個二線城市:
![](http://static.javashuo.com/static/loading.gif)
喜歡的話,點個關注,分享一下吧!
數據結構
本文分享自微信公衆號 - 跟我一塊兒學大數據(java_big_data)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。機器學習