namenode和datanode機制

時間 2019-11-18

標籤 namenode datanode 機制简体版

原文原文鏈接

首先咱們看一下NAMENODE:node

咱們已經知道了NAMENODE做爲DATANODE的管理者，其重要性不言而喻，那麼NAMENODE是怎麼管理數據的呢？oop

首先，咱們看一下上面這張圖，每次客戶端讀寫數據都要先通過NAMENODE，其實就是先查詢NAMENODE中的元數據，那麼問題來了，NAMENODE中的元數據到底是存在內存中仍是存在硬盤中呢？若是存在內存中，一旦斷電就意味着數據的丟失；可是存在硬盤中，讀寫速度必然降低。下面將對其細節進行詳盡的闡述。日誌

經過看以上這幅圖，咱們能夠看到NAMENODE中的元數據既存在在內存中，也存在在硬盤中。咱們先看一下元數據的存儲細節：blog

從左到右依次是存儲路徑，有哪些副本，每一個副本在哪些主機上面存儲。NAMENODE是整個文件系統的管理節點。它維護着整個文件系統的文件目錄樹，文件/目錄的元信息和每一個文件對應的數據塊列表，接受用戶的操做請求。內存

文件包括：it

1.fsimage:元數據鏡像文件，存儲某一時段NAMENODE內存元數據信息。io

2.edits:操做日誌文件。meta

3.fstime:保存最近一次checkpoint的時間。下載

如今咱們回到上一幅圖，請求

1.NAMENODE始終在內存中保存meta.data，用於處理「讀請求」。

2.到有「寫請求」到來時，NAMENODE會首先寫edits到磁盤，即向edits文件中寫日誌，成功返回後，纔會修改內存，而且向客戶端返回。

3.Hadoop會維護一個fsimage文件，也就是namenode中meta.data的鏡像，可是fsimage不會隨時與NAMENODE內存中的meta.data保持一致，而是每隔一段時間經過合併edits文件來更新內容。Secondary NAMENODE就是用來合併fsimage和edits文件來更新NAMENODE的meta.data的。

這裏就用到了Secondary NAMENODE，咱們再來看一張圖：

在這張圖中，咱們能夠看到SN的一些做用，當NN通知SN要進行checkpoint操做的時候，NN就中止向edits日誌中寫數據了，可是寫操做又不能中止，這時候就會向一個edits.new日誌文件中寫數據，而SN會把fsimage和edits裏面的內容下載到SN中，在SN中進行合併，說白了，就是將日誌格式轉化成要存儲的文件格式，產生fsimage.chkpoint文件，並將它上傳給NN，替換fsimage，而且重命名成fsimage，同時edits.new替換edits，而且重命名成edits。詳細過程就是：

那麼何時checkpoint呢？有兩種判別方式：

1.fs.checkpoint.period:指定兩次checkpoint的最大時間間隔，默認是3600秒。

2.fs.checkpoint.size:規定edits文件的最大值，一旦超過這個值則強制checkpoint，無論是否達到最大時間間隔。默認大小是64M。

兩種斷定方式先達到哪一個斷定條件，則先採用哪一個。

咱們再來看一下DATANODE:

DataNode

提供真實文件數據的存儲服務

文件塊：最基本的存儲單位，對於文件內容而言，一個文件的長度大小是size，那麼從文件的0偏移，按照固定的大小，順序對文件進行劃分並編號。劃分好的每一塊稱爲一個Block，默認Block的大小是128M。開始不一樣於普通文件系統的是HDFS中，若是一個文件小於一個數據塊的大小，並不佔用整個數據塊存儲空間。datanode與namenode保存心跳機制，當長時間未向namenode報告，則視爲該datanode死機，namenode會從新備份該datanode上的數據塊。

相關標籤/搜索

namenode+resourcemanager

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。