spark基礎-001

1 概述 ## 1.1 簡介 ## Apache Spark是一個圍繞速度、易用性和複雜分析構建的大數據處理框架。最初在2009年由加州大學伯克利分校的AMPLab開發,並於2010年成爲Apache的開源項目之一。 Spark爲咱們提供了一個全面、統一的框架用於管理各類有着不一樣性質(文本數據、圖表數據等)的數據集和數據源(批量數據或實時的流數據)的大數據處理的需求。 利用內存數據存儲和接近
相關文章
相關標籤/搜索