Spark Standalone架構設計要點分析

Apache Spark是一個開源的通用集羣計算系統,它提供了High-level編程API,支持Scala、Java和Python三種編程語言。Spark內核使用Scala語言編寫,通過基於Scala的函數式編程特性,在不同的計算層面進行抽象,代碼設計非常優秀。 RDD抽象 RDD(Resilient Distributed Datasets),彈性分佈式數據集,它是對分佈式數據集的一種內存抽象
相關文章
相關標籤/搜索