阿里开源的MySQL 数据库增量日志解析,提供增量数据订阅和消费。

jianghang.loujh b48c434ffd fixed phoenix version 3 anni fa
.github df86f94409 fixed issue template 6 anni fa
.mvn e7b81cd83a fixed mvn wrapper 6 anni fa
admin 5cc85ff2de [maven-release-plugin] prepare for next development iteration 4 anni fa
client 40d840375f fixed MR 3 anni fa
client-adapter b48c434ffd fixed phoenix version 3 anni fa
common 5b6fd8094a 增加Apache Pulsar MQ支持 (#3791) 3 anni fa
connector f26b84ffc2 fixed issue #3829 , kafka connector support k8s env 3 anni fa
dbsync 5cc85ff2de [maven-release-plugin] prepare for next development iteration 4 anni fa
deployer 2c892fce9b fixed issue #3484 , fixed bat script 3 anni fa
docker 3bb49e19d2 fixed issue #3576, stop exporter 3 anni fa
driver d79431c7e5 fix typo (#3532) 3 anni fa
example ea20076a32 fix: rowChange typo (#3593) 3 anni fa
filter 5cc85ff2de [maven-release-plugin] prepare for next development iteration 4 anni fa
images 5588da59b9 Update response time image. 6 anni fa
instance 997957d6e0 新增配置 canal.mq.enableDynamicQueuePartition,获取topic对应的队列的数量为分区的数量,以支持动态队列的场景(如阿里云的rocketmq,无法人工设置队列数量,可能会动态伸缩) (#3670) 3 anni fa
meta de95a6a128 refactor: Use Java standard library instead of Guava (#3708) 3 anni fa
parse 40d840375f fixed MR 3 anni fa
prometheus 5cc85ff2de [maven-release-plugin] prepare for next development iteration 4 anni fa
protocol de95a6a128 refactor: Use Java standard library instead of Guava (#3708) 3 anni fa
server 997957d6e0 新增配置 canal.mq.enableDynamicQueuePartition,获取topic对应的队列的数量为分区的数量,以支持动态队列的场景(如阿里云的rocketmq,无法人工设置队列数量,可能会动态伸缩) (#3670) 3 anni fa
sink 5cc85ff2de [maven-release-plugin] prepare for next development iteration 4 anni fa
store 5cc85ff2de [maven-release-plugin] prepare for next development iteration 4 anni fa
.codecov.yml 8cb85753bb open the switch to get codecov test coverage (#1671) 6 anni fa
.gitignore 3d4dbc9a8c fixed issue #2099 , support user/passwd acl and canal admin operator 5 anni fa
.travis.yml eef3bd92ba Improve MAVEN build Performance (#3851) 3 anni fa
LICENSE.txt a0defe575b init 10 anni fa
README.md a5c09c521e Update README.md 4 anni fa
RELEASE.txt a0defe575b init 10 anni fa
codeformat.xml 7ebb3fd1ab fixed code template and format 10 anni fa
codetemplates.xml 7ebb3fd1ab fixed code template and format 10 anni fa
logo.png 3b9ff26d1a add logo 6 anni fa
mvnw 2810e7e815 add mvnw 6 anni fa
pom.xml 5b6fd8094a 增加Apache Pulsar MQ支持 (#3791) 3 anni fa

README.md

build status codecov maven license average time to resolve an issue percentage of issues still open

简介

canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费

早期阿里巴巴因为杭州和美国双机房部署,存在跨机房同步的业务需求,实现方式主要是基于业务 trigger 获取增量变更。从 2010 年开始,业务逐步尝试数据库日志解析获取增量变更进行同步,由此衍生出了大量的数据库增量订阅和消费业务。

基于日志增量订阅和消费的业务包括

  • 数据库镜像
  • 数据库实时备份
  • 索引构建和实时维护(拆分异构索引、倒排索引等)
  • 业务 cache 刷新
  • 带业务逻辑的增量数据处理

当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x

工作原理

MySQL主备复制原理

  • MySQL master 将数据变更写入二进制日志( binary log, 其中记录叫做二进制日志事件binary log events,可以通过 show binlog events 进行查看)
  • MySQL slave 将 master 的 binary log events 拷贝到它的中继日志(relay log)
  • MySQL slave 重放 relay log 中事件,将数据变更反映它自己的数据

canal 工作原理

  • canal 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送dump 协议
  • MySQL master 收到 dump 请求,开始推送 binary log 给 slave (即 canal )
  • canal 解析 binary log 对象(原始为 byte 流)

重要版本更新说明

  1. canal 1.1.x 版本(release_note),性能与功能层面有较大的突破,重要提升包括:
  1. canal 1.1.4版本,迎来最重要的WebUI能力,引入canal-admin工程,支持面向WebUI的canal动态管理能力,支持配置、任务、日志等在线白屏运维能力,具体文档:Canal Admin Guide

文档

多语言

canal 特别设计了 client-server 模式,交互协议使用 protobuf 3.0 , client 端可采用不同语言实现不同的消费逻辑,欢迎大家提交 pull request

canal 作为 MySQL binlog 增量获取和解析工具,可将变更记录投递到 MQ 系统中,比如 Kafka/RocketMQ,可以借助于 MQ 的多语言能力

相关开源&产品

问题反馈