Hadoop系列之Spark安裝和使用(四)

spark簡介 Spark 的主要抽象是分佈式的元素集合(distributed collection of items),稱爲RDD(Resilient Distributed Dataset,彈性分佈式數據集),它可被分發到集羣各個節點上,進行並行操作。RDDs 可以通過 Hadoop InputFormats 創建(如 HDFS),或者從其他 RDDs 轉化而來。 Spark安裝步驟 Spa
相關文章
相關標籤/搜索