Spark入門簡介

定義 分佈式批處理系統和分析挖掘引擎。   特性 1、高效性。Spark基於內存的運算要快100倍以上,基於硬盤的運算也要快10倍以上。Spark實現了高效的DAG(無迴路有向圖)執行引擎,可以通過基於內存來高效處理數據流。 2、易用性。Spark支持Java、Python和Scala的API,還支持超過80種高級算法,使用戶可以快速構建不同的應用。 3、通用性。Spark提供了統一的解決方案。S
相關文章
相關標籤/搜索