BigData————RDD編程

1、定義RDD:      1.RDD 是一個分佈式的,彈性的數據集,是spark應用中最基本的統一的數據格式單位java      RDD分區就是一段連續的數據片python 不一樣的數據源,要統一格式,而這個統一的格式就是RDD。sql spark的計算就是RDD的轉換過程。RDD是能夠讀取的,RDD是不能夠修改的,只能對RDD進行轉換,轉換成新的RDD。編程 每一個spark應用程序都包含一
相關文章
相關標籤/搜索