Spark-core 運行機理

一個簡單的例子 // 須要對名爲逗hello.txt地的HDFS文件進行一次map操做,再進行一次reduce操做。也就是說,須要對一份數據執行兩次算子操做。 // 錯誤的作法:對於同一份數據執行屢次算子操做時,建立多個RDD。 // 這裏執行了兩次textFile方法,針對同一個HDFS文件,建立了兩個RDD出來,而後分別對每一個RDD都執行了一個算子操做。 // 這種狀況下,Spark須要從H
相關文章
相關標籤/搜索