Spark入門:Spark Streaming 概覽

概覽 Spark Streaming是Spark API的一個可橫向擴容,高吞吐量,容錯的實時數據流處理引擎,Spark能夠從Kafka、Flume、Kinesis或者TCP等等輸入獲取數據,然後能夠使用複雜的計算表達式如map,reduce,join和window對數據進行計算。計算完後的數據能夠被推送到文件系統,數據庫,和實時的儀表盤。另外,你也可以使用Spark ML和圖計算處理實時數據流。
相關文章
相關標籤/搜索