淺談自己對HDFS的理解

設計思想 分而治之:將大文件、大批量文件,分佈式存放在大量服務器上,以便於採取分而治之的方式對海量數據進行運算分析;   在大數據系統中作用: 爲各類分佈式運算框架(如:mapreduce,spark,tez,……)提供數據存儲服務   重點概念:文件切塊,副本存放,元數據 首先,它是一個文件系統,用於存儲文件,通過統一的命名空間——目錄樹來定位文件   其次,它是分佈式的,由很多服務器聯合起來實
相關文章
相關標籤/搜索