Apache Spark

Apache Spark™是用於大規模數據處理的統一分析引擎 一、架構及生態 架構示意圖如下: 注:包括SQL和DataFrames,MLlib機器學習, GraphX和Streaming。sparkcore可以用來做離線處理,sparksql可以用來交互式查詢,sparkstreaming用來進行實時處理,MLib用來進行機器學習,GraphX進行圖計算。您可以在同一應用程序中無縫組合這些庫。
相關文章
相關標籤/搜索