shark 簡介

簡介算法 Shark是一個新的數據分析系統,在集羣上進行查詢處理和複雜分析。Shark使用一種新的分佈式內存抽象,爲SQL查詢和複雜分析函數提供了統一的運行引擎,並可以有效的容錯。這種新的分佈式內存抽象使得shark執行SQL查詢的速度比Hive快100倍,執行機器學習算法比Hadoop快100倍。與以前的系統不一樣,shark在取得如此良好性能的同時儘量的保留了相似於mapreduce的執行框架
相關文章
相關標籤/搜索