Spark Streaming學習(1)

Spark Streaming是核心Spark API的擴展,可實現實時數據流的可擴展,高吞吐量,容錯流處理。 數據可以從諸如Kafka,Flume,Kinesis或TCP套接字的許多來源中獲取,並且可以使用由高級功能(如map,reduce,join和window)表達的複雜算法進行處理,處理後的數據可以推送到文件系統,數據庫和實時儀表板。 也可以在數據流上應用Spark的機器學習和圖形處理算法
相關文章
相關標籤/搜索