暑假周進度總結(4)

本週學習了第三章:分佈式文件系統HDFS分佈式

經過本章的學習:我知道分佈式文件系統HDFS其是由不少廉價機器組成,而且其分爲名稱結點和數據結點,名稱結點存儲元數據,而數據結點存儲文件的內容,名稱結點是主結點,數據結點是從結點。HDFS有不少的優良特性,如廉價兼容的硬件設備(機房中的廉價機器)、流數據讀寫、大數據集、簡單的文件模型、強大的跨平臺兼容性,同時也有不少的侷限性:不適合低延遲數據訪問、沒法高效存儲大量小文件、不支持多用戶寫入及任意修改文件。HDFS有兩個重要的文件:Fsimage和Editlog,Fsimage包含文件系統全部目錄和其餘信息,Editlog記錄文件進行的一些增刪改查的操做,而且這些文件都有不少個備份,分佈存儲在不一樣的機器上,因此HDFS就實現了廉價機器的應用,即便某一臺機器壞了,其上邊的文件在其餘的機器上還有不少的備份,一樣能夠找到此文件。學習

HDFS的存儲原理能夠對冗餘數據保存,並能容易檢查數據錯誤、保證數據可靠性、加快數據傳輸速度。還提供數據的存放和獲取的方法,並能對數據的錯誤進行修改和恢復。大數據

相關文章
相關標籤/搜索