HDFS與MapReduce

HDFS基本概念 1、HDFS設計思想 分而治之:將大文件、大批量文件,分佈式存放在大量服務器上,以便於採取分而治之的方式對海量數據進行運算分析 2、概念和特性 概念:HDFS是一個分佈式的文件系統。 特性: (1)HDFS中的文件在物理上是分塊存儲(block),塊的大小可以通過配置參數(dfs.blocksize)來規定,默認大小在hadoop2.x版本中是128M,老版本中是64M (2)H
相關文章
相關標籤/搜索