大數據入門與實戰-Hadoop生態圈技術總覽

1 Hadoop生態圈技術縱覽 2 分佈式概念 3 HDFS 讀寫過程 HDFS 讀過程 HDFS 寫過程 4 僞分佈式集羣 5 MapReduce MapReduce是一個編程框架,允許我們在分佈式環境中對大型數據集執行分佈式和並行處理: MapReduce由兩個不同的任務組成 Map和Reduce。 正如MapReduce的名稱所示,reducer階段發生在mapper階段完成之後。 因此,第
相關文章
相關標籤/搜索