第1章 大數據Spark概述

Spark概述 1.一、什麼是Spark MR的缺點: mr基於數據集計算,因此面向數據web (1)基本運算規則從存儲介質中獲取(採集)數據,而後進行計算,最後將結果存儲到介質中,因此主要應用於一次計算,不適合於數據挖掘和機器學習的迭代計算和圖形挖掘計算。算法 (2)MR基於文件存儲介質的操做,因此性能很是慢。架構 (3)MR和hadoop緊密耦合在一塊兒,沒法動態替換機器學習 Spark的歷史
相關文章
相關標籤/搜索