【308期】面试官：为什么kafka效率这么高？

小半 • 2022年5月17日下午4:12 • 面试题 • 阅读 227

kafka的IO效率这么高的原因：

（1）第一个是在写入数据的时候第一个就是因为kafka是顺序写入数据的，把普通的那种随机IO变成了顺序IO，这样的话写入数据的速度就比较快

（2）第二个就是kafka读取数据的时候是基于sendfile实现Zero Copy

传统的数据读取的流程是：

基于sendfile实现Zero Copy调用read函数，文件数据被copy到内核缓冲区
read函数返回，文件数据从内核缓冲区copy到用户缓冲区
write函数调用，将文件数据从用户缓冲区copy到内核与socket相关的缓冲区。
数据从socket缓冲区copy到相关协议引擎。

但是kafka的读取时这样的：

sendfile系统调用，文件数据被copy至内核缓冲区
再从内核缓冲区copy至内核中socket相关的缓冲区
最后再socket相关的缓冲区copy到协议引擎

（3）第三个就是kafka的数据压缩，Kafka使用了批量压缩，即将多个消息一起压缩而不是单个消息压缩

下面这个图就是传统的数据读取：

【308期】面试官：为什么kafka效率这么高？

这个是kafka使用的零拷贝的数据读取：

【308期】面试官：为什么kafka效率这么高？

（4）第二个就是kafka的生产者在进行生产消息的时候，采用的是批量发送和双线程，其实就是使用了双线程，主线程和Sender线程。

主线程负责将消息置入客户端缓存，Sender线程负责从缓存中发送消息，而这个缓存会聚合多个消息为一个批次。有些消息中间件会把消息直接扔到broker。

感谢阅读，希望对你有所帮助 :)

来源：blog.csdn.net/qq_36520235/article/details/89841798

END

题外推荐

推荐一个“摸鱼程序员”聚集地

●【301期】面试官：dubbo为什么没有采用jdk的spi机制？

●【302期】面试官：幂等性的接口该如何设计?

●【303期】如何理解算法中的时间复杂度？

●【304期】堆排序算法（图解详细流程）

●【305期】面试官：Redis用过是吧？那你讲讲Redis都有哪些监控指标？

●【306期】面试官：解决集群环境下定时任务多次执行的办法有哪些？

●【307期】面试官：什么是NIO？NIO的原理是什么？

与其在网上拼命找题？ 不如马上关注我们~

PS：因为公众号平台更改了推送规则，如果不想错过内容，记得读完点一下“在看”，加个“星标”，这样每次新文章推送才会第一时间出现在你的订阅列表里。点“在看”支持我们吧！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/8417.html

kafka 程序员缓存Java面试题

赞 (0)

0 0

微信精选

一步一图带你深入剖析 JDK NIO ByteBuffer 在不同字节序下的设计与实现

000192

小半
2022年10月29日
技术漫谈

RouterOS（ROS）设置DHCPv6下发的DNS地址方法

000361

小半
2024年3月11日
微信精选

Redis主从复制

000304

小半
2023年1月11日
微信精选

ES近义词搜索

000295

小半
2023年1月11日
Python自学教程教程

jieba，一个优秀的 Python 中文分词库

000323

python学霸
2024年4月21日
Java

JAVA面试备战(十七)–设计模式

000240

小半
2022年9月26日
后端开发

2. 第三方连接池

000279

小半
2022年9月27日
设计模式

设计模式学习教程：模板方法模式

010279

小半
2022年5月7日
PHP

「网络编程」深入浅出Socket网络编程

000222

李, 若俞
2024年3月20日
Android

【重学C/C++系列（九）】：深拷贝和浅拷贝的那点事

000501

小半
2023年3月17日
后端开发

【多图慎入】Git（2）

000236

小半
2022年7月5日
后端开发

Java二十篇: IO流

000272

小半
2022年5月19日

发表回复

登录后才能评论

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！