大數據學習(二十)spark任務提交流程+RDD

簡介 前面我分享了一個spark的wordcount,那麼這篇blog我就簡單的介紹一下spark提交任務的流程。 也就是當我們提交一個jar包到集羣的時候,是如何進行調度和計算的。 然後就是分享一下有關RDD 的東西。RDD是spark框架中的組成單位,也是spark分佈式計算的核心,在我看來,spark分佈式計算完全是由RDD來實現的,所以RDD對於學習spark來說是非常關鍵的。 目錄 簡介
相關文章
相關標籤/搜索