大數據系列之Spark入門簡介

定義 分佈式批處理系統和分析挖掘引擎。node   特性 一、高效性。Spark基於內存的運算要快100倍以上,基於硬盤的運算也要快10倍以上。Spark實現了高效的DAG(無迴路有向圖)執行引擎,能夠經過基於內存來高效處理數據流。算法 二、易用性。Spark支持Java、Python和Scala的API,還支持超過80種高級算法,使用戶能夠快速構建不一樣的應用。緩存 三、通用性。Spark提供了
相關文章
相關標籤/搜索