跟我一起數據挖掘（22）——spark入門

時間 2021-01-02

原文原文鏈接

Spark簡介 Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的並行，Spark，擁有Hadoop MapReduce所具有的優點；但不同於MapReduce的是Job中間輸出結果可以保存在內存中，從而不再需要讀寫HDFS，因此Spark能更好地適用於數據挖掘與機器學習等需要迭代的map reduce的算法。 Spark優點 Spark是基於內存

>>阅读原文<<