Spark Streaming算子篇詳解

Spark Streaming是核心Spark API的擴展,它支持對實時數據流進行可伸縮、高吞吐量和容錯的流處理。數據能夠從Kafka、Flume、Kinesis或TCP套接字等多個源獲取,也可使用map、reduce、join和window等高級函數表示的複雜算法進行處理。最後,能夠將處理過的數據推送到文件系統、數據庫和實時儀表板。事實上,您能夠將Spark的機器學習和圖形處理算法應用於數據流
相關文章
相關標籤/搜索