大數據程序設計：Scala基礎知識

時間 2021-08-15

原文原文鏈接

1)-Spark的前世今生 Spark是類Hadoop MapReduce的通用並行框架中間輸出結果可以保存在內存中適用於數據挖掘與機器學習等需要迭代的MapReduce的算法啓用了內存分佈數據集，優化迭代工作負數 Spark是在Scala語言中實現 Spark和Scala能夠緊密集成，像操作本地集合對象一樣操作分佈式數據集對Hadoop的補充，可以在Hadoop文件系統中並行運行 Spa

>>阅读原文<<