HDFS的介紹

設計思想 分而治之:將大文件、大批量文件,分佈式存放在大量服務器上,以便於採取分而治之的方式對海量數據進行運算分析; 在大數據系統中作用:爲各類分佈式運算框架(如:mapreduce,spark,tez,……)提供數據存儲服務 重點概念:文件切塊,副本存放,元數據 HDSF的重要特性  首先,它是一個文件系統,用於存儲文件,通過統一的命名空間——目錄樹來定位文件  其次,它是分佈式的,由很多服務器
相關文章
相關標籤/搜索