彈性分佈式數據集:一種對內存集羣計算的容錯抽象(三)

說明: 本文是翻譯自講述Spark核心設計思想的經典論文「Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing」。在翻譯的過程中,更系統的理解了Spark中的RDD設計起源、優點與實際應用場景。閱讀這樣的經典文章,讀者也能瞭解到一個大型的數據處理系統,是怎樣被設計出來
相關文章
相關標籤/搜索