Apache Beam 快速入門(Python 版)

Apache Beam 是一種大數據處理標準,由谷歌於 2016 年建立。它提供了一套統一的 DSL 用以處理離線和實時數據,並能在目前主流的大數據處理平臺上使用,包括 Spark、Flink、以及谷歌自身的商業套件 Dataflow。Beam 的數據模型基於過去的幾項研究成果:FlumeJava、Millwheel,適用場景包括 ETL、統計分析、實時計算等。目前,Beam 提供了兩種語言的 S
相關文章
相關標籤/搜索