Spark

Spark 是專爲大規模數據處理而設計的快速通用的計算引擎算法 生態系統圈shell Spark組件數據庫     Core; 核心,實現RDD,API等相關操做,是其餘組件的基礎     SQL: 基於HiveQL與Spark交互的API,其中一個數據庫表看做一個RDD     Streaming: 對實時數據流進行處理和控制,以RDD的方式     MLib: 經常使用的機器學習算法庫, 將算
相關文章
相關標籤/搜索