第1章 大數據Spark概述

Spark概述 1.1、什麼是Spark MR的缺點: mr基於數據集計算,所以面向數據 (1)基本運算規則從存儲介質中獲取(採集)數據,然後進行計算,最後將結果存儲到介質中,所以主要應用於一次計算,不適合於數據挖掘和機器學習的迭代計算和圖形挖掘計算。 (2)MR基於文件存儲介質的操作,所以性能非常慢。 (3)MR和hadoop緊密耦合在一起,無法動態替換 Spark的歷史 (1)2013年6月發
相關文章
相關標籤/搜索