前言 Hadoop / Spark / MapReduce 介紹

一、MapReduce MapReduce是一種軟件框架,可以採用並行、分佈式方式處理GB、TB甚至PB級的大數據集,同時他也是在商用服務器集羣上完成大規模數據處理的執行框架。實現MapReduce的方法有很多,本書主要關注Apache Spark 和 MapReduce/Hadoop兩種實現方法。 MapReduce是一種編程範式,可以利用集羣環境的成百上千臺服務器實現強大的可伸縮性(在這裏,我
相關文章
相關標籤/搜索