Spark四大組件包括Spark Streaming、Spark SQL、Spark MLlib和Spark GraphX。

Spark四大組件包括Spark Streaming、Spark SQL、Spark MLlib和Spark GraphX。它們的主要應用場景是: Spark Streaming: Spark Streaming基於微批量方式的計算和處理,能夠用於處理實時的流數據。它使用DStream,簡單來講就是一個彈性分佈式數據集(RDD)系列,處理實時數據。 Spark SQL: Spark SQL能夠經過
相關文章
相關標籤/搜索