Spark的深刻淺出

Spark的簡介 維基百科: Apache Spark是一個開源的集羣運算框架,最初是由加州大學柏克萊分校AMPLab所開發.相對於Hadoop的MapReduce會在運行完工做後將中介數據存放到磁盤中,Spark使用了內存運算技術,能在數據還沒有寫入硬盤時在內存分析運算.Spark在內存內運算速度能作到比Hadoop MapReduce的運算速度快100倍,即使是運行程序於硬盤時,Spark也能
相關文章
相關標籤/搜索