Spark基礎概念梳理

因爲最近在學習與使用Spark,所以對一些基礎概念與術語做一些梳理。用來加深映像同時方便後續複習 spark是一個基於內存的分佈式計算框架,可無縫集成於現有的Hadoop生態體系。主要包括四大組件:Spark Streaming、Spark SQL、Spark MLlib和Spark GraphX。 Spark運行中涉及到的一些基礎概念如下: mater:主要是控制、管理和監督整個spark集羣
相關文章
相關標籤/搜索