spark基本概念——spark Core

spark優勢: 速度快(相比hadoop) 迭代式、交互式 彈性數據集,容錯 支持有向無環圖的數據優化 (相比於mapreduce:mapreduce自身不支持交互,要支持交互,需要hive等,有交互接口)   spark的幾種運行模式: 批處理:用於大規模的額分佈式數據處理 流方式:spark流用於傳送和處理實時數據 交互方式:常用於處理在內存中的大塊數據,較低的延遲性 (spark內部採用內
相關文章
相關標籤/搜索