對於hadoop生態圈的理解

大數據,首先你要能存的下大數據。程序員 傳統的文件系統是單機的,不能橫跨不一樣的機器。HDFS(Hadoop Distributed FileSystem)的設計本質上是爲了大量的數據能橫跨成百上千臺機器,可是你看到的是一個文件系統而不是不少文件系統。好比你說我要獲取/hdfs/tmp/file1的數據,你引用的是一個文件路徑,可是實際的數據存放在不少不一樣的機器上。你做爲用戶,不須要知道這些,就
相關文章
相關標籤/搜索