Spark的深入淺出

Spark的簡介 維基百科: Apache Spark是一個開源的集羣運算框架,最初是由加州大學柏克萊分校AMPLab所開發.相對於Hadoop的MapReduce會在運行完工作後將中介數據存放到磁盤中,Spark使用了內存運算技術,能在數據尚未寫入硬盤時在內存分析運算.Spark在內存內運算速度能做到比Hadoop MapReduce的運算速度快100倍,即便是運行程序於硬盤時,Spark也能快
相關文章
相關標籤/搜索