Spark與Shark的原理

1.Spark生態圈算法 以下圖所示爲Spark的整個生態圈,最底層爲資源管理器,採用Mesos、Yarn等資源管理集羣或者Spark 自帶的Standalone模式,底層存儲爲文件系統或者其餘格式的存儲系統如HBase。Spark做爲計算框架,爲上層多種應用提供服務。 Graphx和MLBase提供數據挖掘服務,如圖計算和挖掘迭代計算等。Shark提供SQL查詢服務,兼容Hive語法,性能比Hi
相關文章
相關標籤/搜索