spark基礎知識二

主要圍繞spark的底層核心抽象RDD進行理解。主要包括以下幾個方面 RDD彈性分佈式數據集的概念 RDD彈性分佈式數據集的五大屬性 RDD彈性分佈式數據集的算子操作分類 RDD彈性分佈式數據集的算子操作練習 1. RDD是什麼 RDD(Resilient Distributed Dataset)叫做==彈性分佈式數據集==,是Spark中最基本的數據抽象,它代表一個不可變、可分區、裏面的元素可並
相關文章
相關標籤/搜索