乐知付加密服务平台

如果你有资源, 平台可以帮你实现内容变现, 无需搭建知识付费服务平台。

点击访问官方网站 https://lezhifu.cc

扫码关注公众号 乐知付加密服务平台-微信公众号
Flink-cdc所带来的问题 | chenzuoli's blog

Flink-cdc所带来的问题

今天说下flink-cdc吧,最近工作中遇到了一个比较棘手的问题。

flink-logo

我们都知道flink对比其他流计算引擎,其中一个优势就是cdc,它能够作为各个数据源的source和sink,实时接入和实时推送数据,为我们解决了实时接入和推送的问题。

工作中用到了flink mysql-cdc,实时导入mysql数据的增删改,你需要做的就是简单配置一个sql,即可搞定,看下面:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
-- 在Flink创建订单实收source表
CREATE TABLE order_info (
orderCode STRING,
serviceCode STRING,
accountPeriod STRING,
subjectName STRING ,
subjectCode STRING,
occurDate TIMESTAMP,
amt DECIMAL(11, 2),
status STRING,
proc_time AS PROCTIME() -–使用维表时需要指定该字段
) WITH (
'connector' = 'mysql-cdc',
'hostname' = '******',
'port' = '3307',
'username' = '******',
'password' = '******',
'database-name' = 'cdc',
'table-name' = '***',
);

是不是很简单。

一般,如果我们要实时接入mysql的增删改数据,到kafka,通过canal、debezium、maxwell等工具实现,你要做的就是搭一套相应的工作环境,才能顺利到达kafka。
dog
现在我碰到的一个问题是,flink-cdc接入mysql数据,开通了mysql的binlog,当flink去读取binlog之前,会先lock对应mysql实例中的所有库表,不让其他客户端连接做dml操作。
当读完了binlog之后,会释放该锁,其他程序可以正常dml操作了,然后继续锁表,不停循环。

这里有问题的就是,在锁表期间,其他所有表也均不能做dml操作,这时,如果有程序需要做dml操作时,会等待flink-cdc释放全局锁,释放完之后,再进行dml操作。

所以flink-cdc会影响到其他程序的写动作,影响到了业务。

那么有什么解决办法呢?

分析原因,大概了解到,flink-cdc底层也是通过debezium实现的监控mysql binlog,实现实时获取增删改数据,那么该平台在同步binlog时,读取binlog确实需要锁住mysql,不然在读取的时候,还有日志写入binlog,导致读取混乱,所以全局锁是在所难免的。
那怎么办呢?

归其原因,就是业务库mysql和数据同步的对对应的mysql相同,导致在做数据同步的时候,会有影响,如果mysql不一样呢?业务库专门做业务,另一个mysql专门做数据同步,这个mysql作为业务库的slave不就行了?这样互不干扰。

或者大家有没有其他同步mysql增删改数据的方案呢?

欢迎留言。


齐家,治国,平天下。

欢迎关注我的微信公众号,比较喜欢分享知识,也喜欢宠物,所以做了这2个公众号:
程序员写书

喜欢宠物的朋友可以关注:【电巴克宠物Pets】
电巴克宠物

一起学习,一起进步。

-------------本文结束感谢您的阅读-------------