Spark系列1 - Spark生態和RDD

1 Spark的生態 Spark Core中的基本概念 DAG(Directed Acyclic Graph), 有向無環圖。Spark Core提供了有向無環圖的分佈式計算框架,並提供內存機制來支持多次迭代計算或者數據共享,大大減少了迭代計算之間讀取數據的開銷。 RDD(Resilient Distributed Dataset),它是一個分佈在一組節點中的只讀對象集合,這些集合是彈性的,如果數
相關文章
相關標籤/搜索