Spark入門

Spark簡介 基於內存的計算框架,迭代計算效率高,基於DAG的任務調度執行機制。 應用場景 批量數據處理 Spark Core 歷史數據交互查詢 Spark SQL 實時數據流數據處理 Spark Streaming 歷史數據挖掘機器學習 MLlib 圖計算 Graph X 核心概念 RDD:是Resillient Distributed Dataset(彈性分佈式數據集)的簡稱,是分佈式內存的
相關文章
相關標籤/搜索