Spark基礎與Java Api介紹

  一、Spark簡介   1、什麼是Spark     發源於AMPLab實驗室的分佈式內存計算平臺,它克服了MapReduce在迭代式計算和交互式計算方面的不足。     相比於MapReduce,Spark能充分利用內存資源提高計算效率。   2、Spark計算框架     Driver程序啓動很多workers,然後workers在(分佈式)文件系統中讀取數據後轉化爲RDD(彈性分佈式數據
相關文章
相關標籤/搜索