Spark學習-基本名詞理解

分佈式彈性數據集 RDD(Resilient Distribute DataSet) 可以理解爲Spark中用於數據處理的基本數據類型。 詳見:https://blog.csdn.net/weixin_42078760/article/details/107272921 數據分區 Partition RDD在集羣中被切分爲多個分區,每個分區單獨進行計算。 數據塊 Block 每個數據分片在底層存儲
相關文章
相關標籤/搜索