《Spark與Hadoop大數據分析》——2.1 Apache Hadoop概述

2.1 Apache Hadoop概述 Apache Hadoop 是一個軟件框架,可以在具有數千個節點和 PB 級數據的大型集羣上進行分佈式處理。Apache Hadoop 集羣可以使用故障率一般較高的低價通用硬件來構建。Hadoop 的設計能夠在沒有用戶干預的情況下優雅地處理這些故障。此外,Hadoop 採用了讓計算貼近數據(move computation to the data)的方法,從
相關文章
相關標籤/搜索