spark 基礎 上

Spark 是專爲大規模數據處理而設計的快速通用的計算引擎,是apache的一個開源項目。是一種跟hadoop相似的通用分佈式並行計算框架,但是兩者之間還存在一些不同之處。spark是一種基於內存計算的分佈式執行框架,在執行速度上大大優於hadoop. 1. spark的歷史 2009年,spark誕生於加州大學伯克利分校AMPLab. 2010和2012年關於spark的兩篇論文發表:M. Za
相關文章
相關標籤/搜索