Spark(一)-spark安裝與配置

   Spark是整個BDAS的核心組件,是一個大數據分佈式編程框架,不僅實現了MapReduce的算子map 函數和reduce函數及計算模型,還提供更爲豐富的算子,如filter、join、groupByKey等。是一個用來實現快速而同用的集羣計算的平臺。Spark將分佈式數據抽象爲彈性分佈式數據集(RDD),實現了應用任務調度、RPC、序列化和壓縮,併爲運行在其上的上層組件提供API。其底層
相關文章
相關標籤/搜索