Apache Beam研究報告

概述 本文不是一篇Beam的入門文檔,不會介紹Beam的基本概念;而會主要探討Beam的表達力,Beam的性能,以及Beam目前在業內的使用情況。面向的讀者是那些想使用Beam作爲自己公司操作大數據的統一API,但是還有所顧慮的人們。 表達力 離線 Beam裏面有兩個核心原語: ParDo: 來處理通用的基於單條數據的計算: 每條需要處理的數據會被餵給用戶提供的指定的一個函數(Beam裏面的@Pr
相關文章
相關標籤/搜索