spark1——RDD深刻理解

1背景介紹 現今分佈式計算框架像MapReduce和Dryad都提供了高層次的原語,使用戶不用操心任務分發和錯誤容忍,很是容易地編寫出並行計算程序。然而這些框架都缺少對分佈式內存的抽象和支持,使其在某些應用場景下不夠高效和強大。RDD(Resilient Distributed Datasets彈性分佈式數據集)模型的產生動機主要來源於兩種主流的應用場景:算法 Ø  迭代式算法:迭代式機器學習、圖
相關文章
相關標籤/搜索