大數據系列之Spark入門簡介

時間 2020-05-18

標籤數據系列 spark 入門簡介欄目 Spark 简体版

原文原文鏈接

定義分佈式批處理系統和分析挖掘引擎。node 特性一、高效性。Spark基於內存的運算要快100倍以上，基於硬盤的運算也要快10倍以上。Spark實現了高效的DAG（無迴路有向圖）執行引擎，能夠經過基於內存來高效處理數據流。算法二、易用性。Spark支持Java、Python和Scala的API，還支持超過80種高級算法，使用戶能夠快速構建不一樣的應用。緩存三、通用性。Spark提供了

>>阅读原文<<