Spark生態和Spark架構

Spark概覽 Spark 是一個通用的大規模數據快速處理引擎。能夠簡單理解爲 Spark 就是一個大數據分佈式處理框架。 Spark是基於map reduce算法實現的分佈式計算框架,但不一樣的是Spark的中間輸出和結果輸出能夠保存在內存中,從而再也不須要讀寫HDFS,所以Spark能更好地用於數據挖掘與機器學習等須要迭代的map reduce的算法中。node Spark生態系統BDAS 伯
相關文章
相關標籤/搜索