Spark學習-基本名詞理解

分佈式彈性數據集 RDD(Resilient Distribute DataSet) 能夠理解爲Spark中用於數據處理的基本數據類型。web 詳見:https://blog.csdn.net/weixin_42078760/article/details/107272921分佈式 數據分區 Partition RDD在集羣中被切分爲多個分區,每一個分區單獨進行計算。ide 數據塊 Block 每
相關文章
相關標籤/搜索