基於超大規模集羣的本地存儲系統優化

京東大數據平臺部一直致力於優化基礎架構,爲用戶提供穩定、高可靠、高性能、高利用率的超大規模Hadoop集羣。本文與大家分享大規模分佈式存儲集羣的基石——本地存儲系統優化的點點滴滴。 在介紹主要內容前,先熟悉一下高可用Hadoop分佈式文件系統HDFS的核心架構,如下圖: HDFS將大文件切分爲多個數據塊( Block )存儲到多個 DataNode (以下簡稱DN)。 NameNode (以下簡稱
相關文章
相關標籤/搜索