Flink基本認識

時間 2020-05-11

標籤 flink 基本認識简体版

原文原文鏈接

Flink基本架構詳見圖

Flink系統架構中包含了兩個角色，分別是JobManager和TaskManager，是一個典型的Master-Slave架構。JobManager至關因而Master，TaskManager至關因而Slave
web

官方
session

JobManager（JVM進程）詳見圖

JobManager負責整個集羣的資源管理與任務管理，在一個集羣中只能由一個正在工做（active）的 JobManager，若是HA集羣，那麼其餘JobManager必定是standby狀態架構

TaskManager（JVM進程）

負責當前節點上的任務運行及當前節點上的資源管理，TaskManager資源經過TaskSlot進行了劃分，每一個TaskSlot表明的是一份固定資源。例如，具備三個 slots 的 TaskManager 會將其管理的內存資源分紅三等份給每一個 slot。劃分資源意味着 subtask 之間不會競爭內存資源，可是也意味着它們只擁有固定的資源。注意這裏並無 CPU 隔離，當前 slots 之間只是劃分任務的內存資源
負責TaskManager之間的數據交換app

Flink任務調度規則

不一樣Task下的subtask分到同一個TaskSlot，提升數據傳輸效率
相同Task下的subtask不會分到同一個TaskSlot，充分利用集羣資源

client客戶端

負責將當前的任務提交給JobManager，提交任務的經常使用方式：命令提交、web頁面提交。獲取任務的執行信息框架

Flink on Yarn 詳見圖

Flink on Yarn是依託Yarn資源管理器，如今不少分佈式任務均可以支持基於Yarn運行，這是在企業中使用最多的方式。Why？
（1）基於Yarn的運行模式能夠充分使用集羣資源，Spark on Yarn、MapReduce on Yarn、Flink on Yarn等多套計算框架均可以基於Yarn運行，充分利用集羣資源
（2）基於Yarn的運行模式下降維護成本分佈式