这又是一个高频的场景面试题,同时,它也是一个没有标准答案的、可以跟面试官讨论很久的面试题。
对于这个面试题,我的观点是:”没有完美的方案,只有最适合某场景的方案。“
这个问题表面上看是数据一致性的问题,其实根本上,又是数据一致性、系统性能和系统复杂度的选择与取舍。
下面我们先历数一下各种技术方案,环肥燕瘦两相宜,总有一款适合你。
这个方案存在如下问题:
(1)如果先更新MySQL成功了,还未对Redis进行更新的间隙期,这时如果请求过来,读到的都是Redis的更新前数据。
(2)如果先更新MySQL成功了,再更新Redis失败了的话,后面的请求读到的都是Redis的更新前数据,并且后续的补救方案很难做。
补救方案一:为Redis更新失败,将MySQL中的对应数据也回滚了,以此达到两者数据的一致性。但MySQL是主数据源,它代表的是数据的“权威性”,这样做显然并不合理。
补救方案二:通过Redis重试更新的方式进行补救。但如果重试也失败了,还要继续重试吗?是设置固定的重试次数,还是一直重试到成功为止?
另外,重试时间间隔设置多少?时间间隔设置长了,影响业务的时间也会变长;时间间隔设置短了,重试成功率又会降低。这些其实都是问题。
(3)两个线程同时更新的并发问题,如下:
2、先更新Redis,再更新MySQL
这个方案,要比方案一的“先更新MySQL,再更新Redis”合理一些。原因在于更新完Redis的话,哪怕还没更新MySQL,这时如果请求过来,读到的都是Redis更新后的新数据。
另外,先更新Redis成功,再更新MySQL失败,可以通过再删除Redis所对应的数据进行补救。
但其依然存在如下问题:
(1)如果先更新Redis成功了,再更新MySQL失败了的话,还未对Redis所对应的数据进行删除补救的间隙期,这时如果请求过来,读到的都是Redis未生效的新数据。
(2)如果先更新Redis成功了,再更新MySQL失败了的话,然后再删除Redis对应的数据也失败的时候,应该如何处理?如果通过重试机制继续进行删除Redis的话,又会面临之前说的重试次数和间隔期的问题。
(3)两个线程同时更新的并发问题,如下:
3、先更新MySQL,再删除Redis
这个方案可以解决“并发更新”的问题,但依然会存在下面的两个问题:
(1)如果先更新MySQL成功了,还未对Redis进行删除的间隙期,这时如果请求过来,读到的都是Redis的删除前数据。
(2)如果先更新MySQL成功了,再删除Redis失败了的话,后面的请求读到的都是Redis的删除前数据,并且后续的补救方案很难做。
4、先删除Redis,再更新MySQL
这个方案能解决方案3中遗留的两个棘手的问题:
(1)如果先删除Redis成功了,还未对MySQL进行更新的间隙期,此时对于该条数据而言,只存在于MySQL一个存储载体中,也就没有了数据一致性的问题。
(2)如果先删除Redis成功了,再更新MySQL失败了的话,此时对于该条数据而言,只存在于MySQL一个存储载体中,所谓的补救方案也就不需要了,直接当这条数据没更新成功。
OK,整体看起来似乎“天下无贼”了,但真的如此吗?其实不然,如果配合上Redis的“读策略”,还是会有数据一致性的问题。
4.1 先删除Redis,再更新MySQL + Redis读策略
Redis的读策略:
-
如果读取的数据在Redis中存在,则直接返回数据;
-
如果读取的数据在Redis中不存在,则从MySQL中读取数据,然后将数据写入到Redis,并返回数据。
这样一来,就会存在如下问题:
某商品的库存数为10个,用户A购买一件商品时进行库存扣减,因此第一步先删除了Redis中的库存数。
这时,用户B查询该商品的库存,发现Redis中并没有该商品的库存,于是从MySQL中读取库存数后,写入到了Redis中(10个)。
然后,用户A更新数据库,将库存数从10个扣减为9个。
最终,Redis中的库存数是10个,MySQL中的库存数是9个。
4.2 先删除Redis,再更新MySQL + Binlog同步
该方案将填充Redis的操作,改为通过DataBus和Canal同步Binlog的方式,这样可以解决方案4.1中的Redis读策略带来的数据一致性问题。
但是,这种方案的适用于数据量不大,可以完全吃进Redis缓存中,并设置为永不过期的场景。
而那种数据量庞大到不能全部吃进Redis缓存中,需要在数据读取的时机来写入Redis,长时间未被读取的数据则过期淘汰的场景,就不适合了。
因为这种方案的缓存命中率太低了,也就失去了其应有的价值。
4.3 先删除Redis,再更新MySQL + Redis读策略 + 延时双删
这个方案稍复杂了一些,是在方案4.1中“先删除Redis,再更新MySQL + Redis读策略”,又增加了最后一步Redis删除的操作。
它可以解决“最终,Redis中的库存数是10个,MySQL中的库存数是9个”的数据一致性场景。
也可以跟方案4.2中 “数据量庞大到不能全部吃进Redis缓存中,需要在数据读取的时机来写入Redis,长时间未被读取的数据则过期淘汰”的不适合场景进行互补。
有人会说,这种方案也不能100%保证解决数据一致性的问题,如果最后一步删除操作失败了怎么办?
确实,它并不能保证100%。
但如果第一步删除Redis成功了,第二步Redis读策略恰好在这个间隙期发生并写入Redis成功了,而第三步删除Redis又失败了,这种概率有多大?0.0000001%的可能性有没有?
btw:此处请杠精留言,我最喜欢看到你们面红耳赤、声嘶力竭地杠的样子,很性感。
5、分布式锁
有人说,直接用分布式锁,不就把问题都解决了吗?干吗叽叽歪歪地写这么多字?
是的,分布式锁完全可以解决一致性问题,但你别忘了,引入锁机制的最大弊端是什么?是性能。
而我们用Redis当缓存的初衷是什么?还是性能。有句话怎么说的来着?勿忘初心,方得始终。
结语
还是那句话,系统架构设计中,没有银弹,也没有完美的方案,只有最适合某场景的方案。
原文始发于微信公众号(库森学长):面试官:如何保证MySQL和Redis中的数据一致性?
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/165736.html