celery源碼解讀

時間 2019-11-12

標籤 celery 源碼解讀简体版

原文原文鏈接

Celery啓動的入口：redis

文件：Celery/bin/celery.py併發

看下main函數作了什麼事app

能夠看到主要作了幾個事根據-P參數判斷是否須要打patch，若是是gevent或者eventlet則要打對應的補丁。框架

而後執行命令行邏輯async

能夠看到，這邊取出系統參數函數

而後執行基類Command的execute_from_commandline，oop

文件：celery/bin/base.pyfetch

setup_app_from_commandline是核心函數，做用是得到咱們的app對象和得到咱們的配置參數ui

文件：Celery/bin/celery.pyspa

這邊主要獲取啓動類別及啓動參數，咱們的類別是worker因此：

這邊是開始準備啓動對應類別的對象，worker、beat等。

self.commands是支持的命令：

上面咱們知道，咱們的類型是worker，即celery.bin.worker.worker，初始化該類，而後執行run_from_argv函數

文件：celery/bin/worker.py

最後一行會執行到父類的__call__函數，

文件：celery/bin/base.py

這邊主要執行的是run函數

這個函數主要是啓動worker

終於進入worker了，如今這裏涉及一些比較關鍵的東西了，

文件：celery/worker/__init__.py

在WorkController類裏，是worker的基類

這是worker的藍圖，這邊會造成一個依賴圖，是啓動的必要組件，分別負責worker的一部分任務，比較重要的幾個：

Timer：用於執行定時任務的 Timer，和 Consumer 那裏的 timer 不一樣

Hub：Event loop 的封裝對象

Pool：構造各類執行池（線程/進程/協程）的

Beat：建立Beat進程，不過是以子進程的形式運行（不一樣於命令行中以beat參數運行)

文件：celery/apps/worker.py

文件：celery/apps/trace.py

文件：celery/app/base.py

從init_before開始，這邊是最主要的，即綁定全部的task到咱們的app，註冊task在下面

每一個task都有delay和apply_async函數，這個能夠用來幫咱們啓動任務。

文件：celery/worker/__init__.py

這邊是設置關注及不關注的隊列，能夠看到，celery支持ampq協議。

調用setup_includes安裝一些經過CELERY_INCLUDE配置的模塊,保證全部的任務模塊都導入了

最後初始化藍圖，並進行apply完成藍圖各個step的依賴關係圖的構建，並進行各個組件的初始化，依賴在component中已經標出

這個requires就是依賴，說明hub依賴timer，上面藍圖聲明的組件都有互相依賴關係。

回到文件：celery/worker/__init__.py執行start

執行的是藍圖的start。

分別執行各個步驟的start，在apply時，會判斷step是否須要start，不start可是仍要create。

經過啓動日誌看，worker啓動的step爲Pool，和Consumer；

若是換成prefork方式起，worker會多起hub和autoscaler兩個step：

Hub依賴Timer，咱們用gevent，因此include_if是false，這個不須要start。

Hub建立時候引用的kombu的Hub組件，Connection會註冊到Hub，Connection是各類類型鏈接的封裝，對外提供統一接口

Queue依賴Hub，這邊是基於Hub建立任務隊列

下面是咱們的worker啓動的step其中的一個，重點進行說明

初始化線程/協程池，是否彈縮，最大和最小併發數

Celery支持的幾種TaskPool，

咱們是gevent，因此這邊直接找gevent的代碼。

這邊直接引用gevent的Pool

下面看worker啓動的第二個step

能夠看到，這邊啓動的是celery.worker.consumer.Consumer，這邊就會涉及另外一個重要的藍圖了。

文件：celery/worker/consumer，Consumer類

這是Consumer的藍圖，

Consumer啓動的step爲Connection，events，mingle，Gossip，Tasks，Contorl，Heart和event loop。

__init__初始化一些必要的組件，不少都是以前worker建立的。

而後執行blueprint的apply，作的事我worker以前是同樣的。

執行Consumer的start，也就是執行blueprint的start。

啓動的step的基本功能：

Connection：管理和broker的Connection鏈接

Mingle：不一樣worker之間同步狀態用的

Tasks：啓動消息Consumer

Gossip：消費來自其餘worker的事件

Heart：發送心跳事件（consumer的心跳）

Control：遠程命令管理服務

其中Connection，Tasks，Heart和event loop是最重要的幾個。

先看Connection。

使用了consumer的connect()

Conn引用了ampq的connection，ampq的Connection是直接使用的kombu的Connection，上面說過，這個Connection是各類支持的類型（如redis，rabbitMQ等）的抽象，對外提供統一接口。

若是hub存在，會將鏈接註冊到event loop。

再看Tasks：

這邊引用的ampq的TaskConsumer，ampq的TaskConsumer繼承了kombu的Consumer。

能夠看到，在關鍵的幾個地方，celery都引用了kombu，Kombu對全部的MQ進行抽象，而後經過接口對外暴露出一致的API（Redis/RabbitMQ/MongoDB），Kombu對MQ的抽象以下：

Message：生產消費的基本單位，就是一條條消息

Connection：對 MQ 鏈接的抽象，一個 Connection 就對應一個 MQ 的鏈接

Transport：真實的 MQ 鏈接，也是真正鏈接到 MQ(redis/rabbitmq) 的實例

Producers: 發送消息的抽象類

Consumers：接受消息的抽象類

Exchange：MQ 路由，這個和 RabbitMQ 差很少，支持 5種類型

Queue：對應的 queue 抽象，其實就是一個字符串的封裝

Hub是一個eventloop，Connection註冊到Hub，一個Connection對應一個Hub。Consumer綁定了消息的處理函數，每個Consumer初始化的時候都是和Channel綁定的，也就是說咱們Consumer包含了Queue也就和Connection關聯起來了，Consumer消費消息是經過Queue來消費，而後Queue又轉嫁給Channel，再轉給connection，Channel是AMQP對MQ的操做的封裝，Connection是AMQP對鏈接的封裝，那麼二者的關係就是對MQ的操做必然離不開鏈接，可是，Kombu並不直接讓Channel使用Connection來發送/接受請求，而是引入了一個新的抽象Transport，Transport負責具體的MQ的操做，也就是說Channel的操做都會落到Transport上執行。