初識Spark

Spark基礎及架構 Spark是類Hadoop MapReduce的通用並行框架 Job中間輸出結果可以保存在內存,不再需要讀寫HDFS 比MapReduce平均快10倍以上 Spark優勢 速度快 1. 基於內存數據處理,比MR快100個數量級以上(邏輯迴歸算法測試 2. 基於硬盤數據處理,比MR快10個數量級以上 易用性 1. 支持Java、Scala、Python、R語言 2. 交互式sh
相關文章
相關標籤/搜索