重拾Spark 之day04--Spark RDD

發現一篇對Spark RDD講的比較通俗易懂的文章。http://sharkdtu.com/posts/spark-rdd.html Spark核心概念RDD RDD全稱叫做彈性分佈式數據集(Resilient Distributed Datasets),它是一種分佈式的內存抽象,表示一個只讀的記錄分區的集合,它只能通過其他RDD轉換而創建,爲此,RDD支持豐富的轉換操作(如map, join,
相關文章
相關標籤/搜索