Spark的各個組件

一、Spark Core 實現Spark的基本功能,包括任務調度、內存管理、錯誤恢復、與存儲系統交互等,以及RDD(Resilient Distributed Dataset)API的定義。 二、Spark SQL 用Spark來操做結構化數據的程序包。能夠使用SQL或Hive的HQL來查詢數據,並能夠與RDD的操做相結合使用。 三、Spark Streaming 用來對實時數據進行流式計算的組件
相關文章
相關標籤/搜索