spark 初學(一) - 原理

 Apache Spark是一個圍繞速度、易用性和複雜分析構建的大數據處理框架。 優點: Spark提供了一個全面、統一的框架用於管理各種有着不同性質(文本數據、圖表數據等)的數據集和數據源(批量數據或實時的流數據)的大數據處理的需求 Spark可以將Hadoop集羣中的應用在內存中的運行速度提升100倍,甚至能夠將應用在磁盤上的運行速度提升10倍 使用情景:1  數據量大   2  計算複雜 s
相關文章
相關標籤/搜索