大數據簡介

大數據介紹 大數據本質也是數據,但是又有了新的特徵: 數據來源廣 數據量大(最少也是TB級別的、甚至可能是PB級別) 數據格式多樣化(結構化數據、非結構化數據、Excel文件、文本文件等) 數據增長速度快 針對以上主要的4個特徵我們需要考慮以下問題: 數據來源廣,該如何採集彙總?對應出現了Sqoop、Cammel、Datax等工具。 數據採集之後,該如何存儲?對應出現了GFS、HDFS、TFS等分
相關文章
相關標籤/搜索