spark中RDD算子介紹

1. spark簡介 Spark可以用於批處理、交互式查詢(Spark SQL)、實時流處理(Spark Streaming)、機器學習(Spark MLlib)和圖計算(GraphX)。 Spark是MapReduce的替代方案,而且兼容HDFS、Hive,可融入Hadoop的生態系統,以彌補MapReduce的不足。 2. RDD簡介 RDD(Resilient Distributed Dat
相關文章
相關標籤/搜索