Canal 組件簡介與 vivo 賬號實踐

時間 2020-12-08

標籤 java mysql git github sql 數據庫 api 數組緩存網絡欄目 Java 简体版

原文原文鏈接

互聯網應用隨着業務的發展，部分單表數據體量愈來愈大，應對服務性能與穩定的考慮，有作分庫分表、數據遷移的須要，本文介紹了vivo賬號應對以上需求的實踐。java

1、前言

Canal 是阿里巴巴開源項目，關於什麼是 Canal？又能作什麼？我會在後文爲你們一一介紹。
在本文您將能夠了解到vivo賬號使用 Canal 解決了什麼樣的業務痛點，基於此但願對您所在業務能有一些啓示。mysql

2、Canal介紹

1. 簡介

Canal [kə'næl]，譯意爲水道/管道/溝渠，主要用途是基於 MySQL 數據庫增量日誌解析，提供增量數據訂閱和消費。git

早期阿里巴巴由於杭州和美國雙機房部署，存在跨機房同步的業務需求，實現方式主要是基於業務 trigger 獲取增量變動。從 2010 年開始，業務逐步嘗試數據庫日誌解析獲取增量變動進行同步，由此衍生出了大量的數據庫增量訂閱和消費業務。github

2. 工做原理

2.1 MySQL 主備複製原理

Canal最核心的運行機制就是依賴於MySQL的主備複製，咱們優先簡要說明下MySQL主備複製原理。sql

MySQL master 將數據變動寫入二進制日誌( binary log, 其中記錄叫作二進制日誌事件binary log events，能夠經過 show binlog events 進行查看)。數據庫

MySQL slave 將 master 的 binary log events 拷貝到它的中繼日誌(relay log)。api

MySQL slave 重放 relay log 中事件，將數據變動反映它本身的數據。數組

2.2 MySQL Binary Log介紹

MySQL-Binlog是 MySQL 數據庫的二進制日誌，用於記錄用戶對數據庫操做的SQL語句（除了數據查詢語句）信息。緩存

若是後續咱們須要配置主從數據庫，若是咱們須要從數據庫同步主數據庫的內容，咱們就能夠經過 Binlog來進行同步。網絡

2.3 Canal 工做原理

Canal 模擬MySQL slave的交互協議，假裝本身爲MySQL slave，向MySQL master發送dump協議。

MySQL master收到dump請求，開始推送binary log給slave（也就是Canal）。

Canal 解析 binary log 對象(原始爲byte流)。

Canal 把解析後的 binary log 以特定格式的進行推送，供下游消費。

2.4 Canal 總體架構

說明：

server 表明一個canal運行實例，對應於一個jvm
instance 對應於一個數據隊列（1個server對應1..n個instance)

instance模塊：

EventParser(數據源接入，模擬slave協議和master進行交互，協議解析)
與數據庫交互模擬從庫，發送dump binlog請求，接收binlog進行協議解析並作數據封裝，並將數據傳遞至下層EventSink進行存儲，記錄binlog同步位置。
EventSink(Parser和Store連接器，進行數據過濾，加工，分發的工做)
數據過濾、數據歸併、數據加工、數據路由存儲。
EventStore(數據存儲)
管理數據對象存儲，包括新binlog對象的寫入管理、對象訂閱的位置管理、對象消費成功的回執位置管理。
MetaManager(增量訂閱&消費信息管理器)
負責binlog對象總體的發佈訂閱管理器，相似於MQ。

2.5 Canal 數據格式

下面咱們來一塊兒看下Canal內部封裝的 Binlog對象格式，更好的理解 Canal。

Canal可以同步 DCL、 DML、 DDL。

業務一般關心 INSERT、 UPDATE、 DELETE引發的數據變動。

EntryProtocol.proto

Entry
    Header
        logfileName [binlog文件名]
        logfileOffset [binlog position]
        executeTime [binlog裏記錄變動發生的時間戳]
        schemaName [數據庫實例]
        tableName [表名]
        eventType [insert/update/delete類型]
    entryType   [事務頭BEGIN/事務尾END/數據ROWDATA]
    storeValue  [byte數據,可展開，對應的類型爲RowChange]
 
RowChange
    isDdl       [是不是ddl變動操做，好比create table/drop table]
    sql     [具體的ddl sql]
    rowDatas    [具體insert/update/delete的變動數據，可爲多條，1個binlog event事件可對應多條變動，好比批處理]
        beforeColumns [Column類型的數組]
        afterColumns [Column類型的數組]
 
Column
    index       [column序號]
    sqlType     [jdbc type]
    name        [column name]
    isKey       [是否爲主鍵]
    updated     [是否發生過變動]
    isNull      [值是否爲null]
    value       [具體的內容，注意爲文本]

2.6 Canal 示例 demo

下面咱們經過實際代碼邏輯的判斷，查看 Binlog解析成Canal 對象的數據模型，加深理解

insert 語句

delete語句

update語句

2.7 Canal HA 機制

線上服務的穩定性極爲重要，Canal是支持HA的，其實現機制也是依賴Zookeeper來實現的，與HDFS的HA相似。

Canal的HA分爲兩部分，Canal server和Canal client分別有對應的HA實現。

Canal Server：爲了減小對mysql dump的請求，不一樣server上的instance要求同一時間只能有一個處於running，其餘的處於standby狀態。
Canal Client：爲了保證有序性，一份instance同一時間只能由一個canal client進行get/ack/rollback操做，不然客戶端接收沒法保證有序。

依賴Zookeeper的特性（本文不着重講解zookeeper特性，請在網絡上查找對應資料）：

Watcher機制
EPHEMERAL節點(和session生命週期綁定)

大體步驟：

Canal server要啓動某個canal instance時都先向zookeeper進行一次嘗試啓動判斷 (實現：建立EPHEMERAL節點，誰建立成功就容許誰啓動)。

建立 ZooKeeper節點成功後，對應的Canal server就啓動對應的Canal instance，沒有建立成功的Canal instance就會處於standby狀態。

一旦ZooKeeper發現Canal server A建立的節點消失後，當即通知其餘的Canal server再次進行步驟1的操做，從新選出一個Canal server啓動instance。

Canal client每次進行connect時，會首先向ZooKeeper詢問當前是誰啓動了Canal instance，而後和其創建連接，一旦連接不可用，會從新嘗試connect。

2.8 Canal 使用場景

上面介紹了Canal 的原理與運行機制，下面咱們從實際場景來看，Canal 可以爲咱們業務場景解決什麼樣的問題。

2.8.1 不停服遷移

業務在發展初期，爲了快速支撐業務發展，不少數據存儲設計較爲粗放，好比用戶表、訂單表可能都會設計爲單表，此時常規手段會採用分庫分表來解決容量和性能問題。

但數據遷移會面臨最大的問題：線上業務須要正常運行，若是數據在遷移過程當中有變動，如何保證數據一致性是最大的挑戰。

基於Canal，經過訂閱數據庫的 Binlog，能夠很好地解決這一問題。

可詳見下方vivo賬號的不停機遷移實踐。

2.8.2 緩存刷新

互聯網業務數據源不只僅爲數據庫，好比 Redis 在互聯網業務較爲經常使用，在數據變動時須要刷新緩存，常規手段是在業務邏輯代碼中手動刷新。

基於Canal，經過訂閱指定表數據的Binlog，能夠異步解耦刷新緩存。

2.8.3 任務下發

另外一種常見應用場景是「下發任務」，當數據變動時須要通知其餘依賴系統。

其原理是任務系統監聽數據庫變動，而後將變動的數據寫入MQ/Kafka進行任務下發。

好比賬號註銷時下游業務方須要訂單此通知，爲用戶刪除業務數據，或者作數據歸檔等。

基於Canal能夠保證數據下發的精確性，同時業務系統中不會散落着各類下發MQ的代碼，從而實現了下發歸集，以下圖所示：

2.8.4 數據異構

在大型網站架構中，數據庫都會採用分庫分表來解決容量和性能問題，但分庫分表以後帶來的新問題。

好比不一樣維度的查詢或者聚合查詢，此時就會很是棘手。通常咱們會經過數據異構機制來解決此問題。

所謂的數據異構，那就是將須要join查詢的多表按照某一個維度又聚合在一個DB中。

基於Canal能夠實現數據異構，以下圖示意：

三、Canal 的安裝及使用

Canal的詳細安裝、配置與使用，請查閱官方文檔 >\> 連接

3、賬號實踐

一、實踐一：分庫分表

1.1 需求

難點：

表數據量大，單表3億多。

常規定時任務遷移全量數據，時間長且對業務有損。

核心訴求：

不停機遷移，最大化保證業務不受影響

「給在公路上跑着的車換輪胎」

1.2 遷移方案

1.3 遷移過程

總體過程大體以下：

分析賬號現有痛點

單表數據量過大：賬號單表3億+
用戶惟一標識過多

業務劃分不合理

肯定分庫分表方案
存量數據遷移方案

使用傳統的定時任務遷移，時長過長，且遷移過程當中爲了保證數據一致性，須要停機維護，對用戶影響較大。
肯定使用canal進行遷移，對canal作充分調研與評估，與中間件及DBA共同肯定，可支持全量、以及增量同步。

遷移過程經過開關進行控制，單表模式 → 雙寫模式 → 分表模式。
數據遷移週期長，遷移過程當中遇到部分未能預估到的問題，進行了屢次遷移。
遷移完成後，正式切換至雙寫模式，即單表及分表一樣寫入數據，此時數據讀取仍然在單表模式下讀取數據，Canal仍然訂閱原有單表，進行數據變動。
運行兩週後線上未產生新問題，正式切至分表模式，此時原有單表再也不寫入數據，即單表不會再有新的Binlog產生，切換後線上出現了部分問題，即時跟進處理，「有驚無險」。