使用 Apache Flink 開發實時 ETL

Apache Flink 是大數據領域又一新興框架。它與 Spark 的不同之處在於,它是使用流式處理來模擬批量處理的,因此能夠提供亞秒級的、符合 Exactly-once 語義的實時處理能力。Flink 的使用場景之一是構建實時的數據通道,在不同的存儲之間搬運和轉換數據。本文將介紹如何使用 Flink 開發實時 ETL 程序,並介紹 Flink 是如何保證其 Exactly-once 語義的。
相關文章
相關標籤/搜索