【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

小半 • 2022年5月17日下午4:17 • 面试题 • 阅读 226

围观：

推荐一位大神朋友

MySQL + HBase是我们日常应用中常用的两个数据库，分别解决应用的在线事务问题和大数据场景的海量存储问题。

从架构对比看差异

相比MySQL，HBase的架构特点:

完全分布式（数据分片、故障自恢复)
底层使用HDFS(存储计算分离)。

由架构看到的能力差异:

MySQL:运维简单(组件少)、延时低(访问路径短)
HBase:扩展性好、内置容错恢复与数据冗余

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

从引擎结构看差异

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

相比MySQL，HBase的内部引擎特点:

HBase原生没有sQL引擎(无法使用sQL访问，使用APlI)，云HBase增强版(Lindorm)及开源Phoenix均提供sQL能力
HBase使用LSM(Log-Structure Merge)树，,Innodb使用B+树。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

由引擎结构(B+Tree vs LSM Tree)看到的能力差异:

MySQL:读写均衡、存在空间碎片
HBase:侧重于写、存储紧凑无浪费、Io放大、数据导入能力强

关于LSM树和B+树的理解

目的是为了减少磁盘IO，

索引：某种数据结构，方便查找数据

hash索引不利于范围查询，使用树结构

B+树

从磁盘读数据是以页为单位，根据这个特点使用平衡多路查找树
B+树的非叶子节点存放索引，叶子节点存放数据
非叶子节点能够存放更多的索引，树的高度更低
叶子节点通过指针相连，有利于区间查询
叶子节点和根节点的距离基本相同，查找的效率稳定
数据插入导致叶子节点分裂，最终导致逻辑连续的数据存放到不同物理磁盘块位置，导致区间查询效率下降

LSM Tree

LSM（Log-Structured Merge），LevelDB，RocksDB，HBase，Cassandra等都是基于LSM结构
HDD，SSD顺序读写的速度都高于随机读写，写入日志就是顺序写
WAL，memtable，sstable
有利于写，不利于读，先从memtable查找，再到磁盘所有的sstable文件查找
Compaction的目的是减少sstable文件数量，缓解读放大的问题，加速查找可以对sstable文件使用布隆过滤器
Compaction策略

STCS（SIze-Tiered Compaction Strategy）空间放大和读放大问题
LCS（Leveled Compaction Strategy）写放大问题

Compaction会引入写放大问题，在Value较大时采用KV分离存储缓解写放大
写操作多于读操作时，LSM树有更好的性能，因为随着insert操作，为了维护B+树结构，节点分裂。读磁盘的随机读写概率会变大，性能会逐渐减弱。LSM树相比于B+树，多次单页随机写变成一次多页随机写,复用了磁盘寻道时间，极大提高写性能。不过付出代价就是放弃部分读性能。推荐：Java进阶视频资源

数据访问

相同之处:数据以表的模型进行逻辑组织，应用对数据进行增删改查
不同之处:MySQL的SQL功能更丰富:事务能力更强，HBase既可以用APIl进行更灵活、性能更好的访问，也可以借助Phoenix使用标准sQL访问;只支持单行事务

HBase的特色功能–TTL

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

HBase的特色功能—多版本

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

HBase的特色功能—多列簇

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

HBase的特色功能—MOB

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

从生态看差异

MySQL:满足APP的在线数据库存储，一般有我足矣

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

大数据圈:应用于大数据场景的存储、计算及管理组件

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

MySQL:一般可独立满足在线应用的数据存储需求，或者与少量组件配合(如缓存、分库中间件)
HBase:一般需要和较多大数据组件一起配合完成应用场景，场景架构的设计、实施存在较大的挑战

总结

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

哪些场景的存储适合HBase ?

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

HBase不是MySQL的替换，HBase是业务规模及场景扩张后，对MySQL的自然延伸

【349期】面试官：MySQL和Hbase的区别是什么？各自适用什么场景。

感谢阅读，希望对你有所帮助 :)

来源：blog.csdn.net/weixin_41605937/

article/details/110933984

主流Java进阶技术（学习资料分享）

与其在网上拼命找题？ 不如马上关注我们~

PS：因为公众号平台更改了推送规则，如果不想错过内容，记得读完点一下“在看”，加个“星标”，这样每次新文章推送才会第一时间出现在你的订阅列表里。点“在看”支持我们吧！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/8724.html

Java MySQL 分布式日志架构Java面试题

赞 (0)

0 0

后端开发

项目中的三峡大坝–拦截器

000245

小半
2022年9月20日
后端开发

虚拟线程 – VirtualThread源码透视

000295

小半
2022年10月6日
面试题

50例常见的SQL面试题

000383

小半
2022年5月7日
开源速递

3.5K Star，开源100万次下载！网页也可以管理你的服务器

000263

小半
2024年3月19日
技术漫谈

高并发这样用SimpleDateFormat，快醒醒

000285

小半
2024年3月31日
微信精选

我向 IDEA 提交了一个 BUG

000286

小半
2023年8月16日
后端开发

并行流ParallelStream中隐藏的陷阱

000231

小半
2022年10月6日
技术漫谈

面试和工作使用的13条sql技巧

000237

java小白
2024年3月23日
Docker第三章Docker常用命令

000165

小半
2022年5月5日
Android

App启动流程【1】Launcher 启动 App

000431

小半
2023年1月30日
微信精选

巨杉数据库双机房容灾切换剖析

000300

小半
2023年11月9日
Android

Kotlin系列: 一、Kotlin入门

000260

小半
2022年12月12日

发表回复

登录后才能评论

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！