大數據 - 第十一課 : Spark惰性計算及簡單實踐

開源軟件迭代較慢 DAG:有向無環圖 Hadoop計算中間結果落到磁盤,內存佔用小 Spark惰性計算,遇到Action算子才執行,內存佔用較大,資源利用率較低 RDD:是Resillient Distributed Dataset(彈性分佈式數據集)的簡稱,是分佈式內存的一個抽象概念,提供了一種高度受限的共享內存模型 DAG:是Directed Acyclic Graph(有向無環圖)的簡稱,反
相關文章
相關標籤/搜索