Spark 基礎教程

Spark是基於內存計算的大數據並行計算框架,可用於構建大型的、低延遲的數據分析應用程序。 Spark特點 運行速度快:Spark使用先進的DAG(Directed Acyclic Graph,有向無環圖)執行引擎,以支持循環數據流與內存計算,基於內存的執行速度可比Hadoop MapReduce快上百倍,基於磁盤的執行速度也能快10倍。 容易使用:Spark支持使用Scala、Java、Pyth
相關文章
相關標籤/搜索