Spark學習筆記四:算子

一、什麼是算子 算子是RDD中定義的函數,可以對RDD中的數據進行轉換和操作(transformation和action) transformation不觸發提交作業;action出發SparkContext提交Job作業 二、常用算子不完全歸納 Transformation轉換操作 基礎轉換操作 map、mapPartitions、mapPartitionsWithIndex distinct:
相關文章
相關標籤/搜索