Spark的RDD原理以及2.0特性的介紹(轉)

Spark 是什麼  Spark 是 Apache 頂級項目裏面最火的大數據處理的計算引擎,它目前是負責大數據計算的工作。包括離線計算或交互式查詢、數據挖掘算法、流式計算以及圖計算等。全世界有許多公司和組織使用或給社區貢獻代碼,社區的活躍度見 www.github.com/apache/spark。 2013 年開始 Spark開發團隊成立 Databricks,來對 Spark 進行運作和管理,
相關文章
相關標籤/搜索