Spark RDD概念學習系列之RDD的創建(六)

RDD的創建      兩種方式來創建RDD:     1)由一個已經存在的Scala集合創建     2)由外部存儲系統的數據集創建,包括本地文件系統,還有所有Hadoop支持的數據集,比如HDFS、Cassandra、HBase、Amazon S3等。     RDD只能基於在穩定物理存儲中的數據集和其他已有的RDD上執行確定性操作來創建。這些確定性操作稱爲轉換,如map、filter、gro
相關文章
相關標籤/搜索