00-Spark介紹

什麼是Spark? Apache Spark是一個圍繞速度、易用性和複雜分析構建的大數據處理框架。最初在2009年由加州大學伯克利分校的AMPLab開發,並於2010年成爲Apache的開源項目之一。 與Hadoop和Storm等其他大數據和MapReduce技術相比,Spark有如下優勢。 首先,Spark爲我們提供了一個全面、統一的框架用於管理各種有着不同性質(文本數據、圖表數據等)的數據集和
相關文章
相關標籤/搜索