大數據1 ---Spark 基礎解析

Hadoop 歷史   2003和2004年的Google兩篇論文   發展歷史: 2011年 1.0版本 2012年 穩定版本 2013年 2.x版本, YARN   MR的缺點:基於數據集的計算,面向數據,基本運算規則是從存儲介質中獲取(採集)數據,然後進行計算,將最後的結果存儲回介質中,主要用於一次性計算。不適合數據挖掘和機器學習這樣的一種迭代計算。MR是基於文件存儲介質的計算,所以性能非常
相關文章
相關標籤/搜索