爲何HDFS是大數據分析的軟肋

分佈式文件系統是大型分析非常重要的一環。即使你是在使用Spark,你仍然需要將大量的數據快速的存入內存,所以文件系統一定要可以是高速率的。但是,HDFS並不像它標榜的那樣好,它是大數據分析的薄弱環節。 什麼是分佈式文件系統?普通的文件系統是基於塊來存儲文件的。查找文件時,要去磁盤中匹配每一個塊。一般是有文件分配表或多種FAT的。但是,分佈式文件系統的物理存儲資源是不一定直接連接在本地節點上的,而是
相關文章
相關標籤/搜索