Python海量數據處理之_Hadoop(二)概念和原理

1. 說明  Hadoop是個分佈式的架構,它將海量數據處理工作分配到集羣中的多個機器上運行。前篇介紹了Hadoop的安裝,在安裝過程中會產生一些疑問,比如NameNode是什麼東西?本篇就以問題&解答的方式介紹Hadoop的相關概念及其原理。 2. NameNode,DataNode,以及Secondary NameNode  把Hadoop分爲HDFS和MapReduce。HDFS爲數據提供了
相關文章
相關標籤/搜索