大數據程序設計:Scala基礎知識

1)-Spark的前世今生 Spark是類Hadoop MapReduce的通用並行框架 中間輸出結果可以保存在內存中 適用於數據挖掘與機器學習等需要迭代的MapReduce的算法 啓用了內存分佈數據集,優化迭代工作負數 Spark是在Scala語言中實現 Spark和Scala能夠緊密集成,像操作本地集合對象一樣操作分佈式數據集 對Hadoop的補充,可以在Hadoop文件系統中並行運行 Spa
相關文章
相關標籤/搜索