學習大數據的方向

大數據本質也是數據,但是又有了新的特徵,包括數據來源廣、數據格式多樣化(結構化數據、非結構化數據、Excel文件、文本文件等)、數據量大(最少也是TB級別的、甚至可能是PB級別)、數據增長速度快等。 針對以上主要的4個特徵我們需要考慮以下問題: 數據來源廣,該如何採集彙總?對應出現了Sqoop,Cammel,Datax等工具。 數據採集之後,該如何存儲?對應出現了GFS,HDFS,TFS等分佈式文
相關文章
相關標籤/搜索