第一天:spark基礎

Hadoop體系回顧 Hadoop 的概念可追溯到 2003,2004 Google2篇論文(老版三輛馬車),2011年發佈1.0版本,2012年發佈穩定版。 Hadoop 在2.0版本以前組件主要是 HDFS跟MapReduce。html 1.0版本框架主要以下: 職責:java HDFS負責文件存儲 MapReduce負責資源調度跟計算node 缺點:git mr基於數據集的計算,因此面向數據
相關文章
相關標籤/搜索