hadoop(1) HDFS的概念、原理及基本操作

1. HDFS的基本概念和特性 設計思想——分而治之:將大文件、大批量文件分佈式存放在大量服務器上,以便於採取分而治之的方式對海量數據進行運算分析。在大數據系統中作用:爲各類分佈式運算框架(如:mapreduce,spark,tez,…)提供數據存儲服務。 1.1 HDFS的概念 首先,它是一個文件系統,用於存儲文件,通過統一的命名空間–目錄樹來定位文件; 其次,它是分佈式的,有很多服務器聯合起來
相關文章
相關標籤/搜索