初識Hadoop(1)

一些基本問題: 1 避免數據丟失的常見做法是複製:通過系統保存數據的冗餘副本,在故障發生時,可以使用數據的另一個副本,這就是冗餘磁盤陣列的工作方式。 Hadoop的文件系統HDFS(Hadoop Distributed Filesystem) 2 大部分分析任務需要通過某種方式把數據合併起來。MapReduce提供一個編程模型,其抽象出磁盤讀寫的問題,將其轉換爲計算一個由成對鍵值組成的數據集。這個
相關文章
相關標籤/搜索