(重要)spark RDD核心知識

spark 核心是RDD:彈性分佈式數據集 基本RDD 轉換運算 創建intRDD 創建stringRDD map 運算 filter 數字運算 filter 字符串運算 distinct 運算 去除重複元素 randomSplit 運算 隨機按照比例分爲多個RDD 如下比例:0.4:0.6 groupBy 運算 根據匿名函數規則,分爲多個Array 多個RDD 轉換運算 創建3個範例RDD un
相關文章
相關標籤/搜索