Hadoop進階

hadoop模仿谷歌大數據技術,開源。 Hadoop 開源的,分佈式存儲+分佈式計算平臺 兩個核心組成: HDFS:分佈式文件系統,存儲海量的數據 MapReduce: 並行處理框架,實現任務分解和調度 可以用來做什麼? 搭建大型數據倉庫,PB級數據的存儲、處理、分析、統計等業務。 優勢: 高擴展 低成本 成熟的生態圈 應用情況 百度,騰訊,阿里都在用 生態系統 HIVE, habse和hdfs區
相關文章
相關標籤/搜索