網上看到一張關於hadoop分佈式文件系統(hdfs)的工做原理的圖片,其實主要是介紹了向hdfs寫一個文件的流程。圖中的流程已經很是清晰,直接上圖html
好吧,博客園告訴我少於200字的文章不容許發佈到網站首頁,我只能巴拉巴拉多扯幾句了。之前一直覺得從Client端寫大文件到hdfs中須要先把文件所有傳到Namenode上,而後由namenode來按塊切分,並分發到Datanode上去。仍是too young, too simple呀,上圖簡單的幾個圖讓我茅塞頓開,文件的分割由client端完成,並由client端與Namenode分配的datanodes通信並進行數據傳輸,Namenode端並不參與數據I/O的過程,這樣也大大減輕了Namenode的壓力,perfect design!!!,之後仍是要好好的讀源代碼。node
吐槽完畢,200字應該有了吧。。。分佈式
本文來自博客園,若是查看原文請點擊 http://www.cnblogs.com/meibenjin/p/3299003.html oop