spark 基礎 下

上篇介紹了spark的突出特色以及基本框架,下面給你們介紹下spark的基本數據結構、spark任務調度的詳細流程以及spark中stage的劃分。算法 5. spark的基本數據類型 RDD、DataFrame和DataSet能夠說是spark獨有的三種基本的數據類型。Spark的核心概念是RDD (resilientdistributed dataset),指的是一個只讀的,可分區的分佈式數據
相關文章
相關標籤/搜索