Databrick 's Blog on Spark Structured Streaming Summary Part1 實時數據使用Structured Streaming的ETL操做

Part1 實時數據使用Structured Streaming的ETL操做 1.1 Introduction 在大數據時代中咱們迫切須要實時應用解決源源不斷涌入的數據,然而創建這麼一個應用須要解決多個問題:  1. 提供端到端的可靠性與正確性  2. 執行復雜轉換(JSON, CSV, etc.)  3. 解決亂序數據  4. 與其餘系統整合(Kafka, HDFS, etc.)html Str
相關文章
相關標籤/搜索