spark總結

1、什麼是RDD? RDD的5大特性。     RDD是spark中的一種抽象,他是彈性分佈式數據集.     a) RDD由一系列的partition組成     b) 算子作用在partition上     c) RDD之間具有依賴關係     d) partition提供了最佳計算位置(體現了移動計算不移動數據思想)     e) 分區器作用在K、V格式的RDD上。     哪裏體現了彈性、
相關文章
相關標籤/搜索