spark基礎

1. Spark概述 1.1Spark是什麼 Spark是內存計算系統,2009年它出品於UCBerkeley AMPLab伯克利下屬實驗室,它最早是一片博士論文,論述如何提高map和reduce的效率。後來就針對這篇論文寫出了相應的實現。2013年6月捐贈了給Apache,2014年2月成爲Apache的頂級項目。 最大節點的集羣來自騰訊,8000個節點,單個job最大分別是阿里巴巴和Datab
相關文章
相關標籤/搜索