Apache Beam的架構概覽

  Apache Beam是一個開源的數據處理編程庫,由Google貢獻給Apache的項目,前不久剛剛成爲Apache TLP項目。它提供了一個高級的、統一的編程模型,允許我們通過構建Pipeline的方式實現批量、流數據處理,並且構建好的Pipeline能夠運行在底層不同的執行引擎上。剛剛接觸該開源項目時,我的第一感覺就是:在編程API的設計上,數據集及其操作的抽象有點類似Apache Cru
相關文章
相關標籤/搜索