大數據1 ---Spark 基礎解析

時間 2021-01-07

標籤人工智能系列大數據1-spark中的dataframe 欄目 Spark 简体版

原文原文鏈接

Hadoop 歷史 2003和2004年的Google兩篇論文發展歷史： 2011年 1.0版本 2012年穩定版本 2013年 2.x版本， YARN MR的缺點：基於數據集的計算，面向數據，基本運算規則是從存儲介質中獲取（採集）數據，然後進行計算，將最後的結果存儲回介質中，主要用於一次性計算。不適合數據挖掘和機器學習這樣的一種迭代計算。MR是基於文件存儲介質的計算，所以性能非常

>>阅读原文<<