转载：Mysql InnoDB中究竟存的是什么

转载于：抛开数据结构，InnoDB中B+树究竟存的是什么

文章目录

提出问题

InnoDB中B+树各个节点存储的内容是什么？
InnoDB中索引的种类有哪些？它们节点存储的内容各自有什么区别？

数据页

InnoDB中页是内存和磁盘交互的基本单位，默认是16KB。其中存储用户记录的页被称为数据页，也被称为索引页。

数据页的组成

其中我们重点关注的就是 User Record 和 Page Directory 两个组成部分。

User Record 用于存储真实的用户数据。
Page Directory 可以理解为对 UserRecord 中的数据建立的目录。

下面我们来详细对这两个结构进行分析。

User Record

User Record 是数据页中真实存储用户数据的组成部分。

User Record的特点

数据与数据之间是单向链表，从上一个数据可以找到下一个数据。
数据按照主键的顺序进行排序。
InnoDB对User Record中的数据进行分组，最多一个分组里面存储8条数据。

这里我们思考下，为什么需要对数据进行分组？

我们想一下场景，当我们根据主键查询一条记录时，如果只有单向链表的特点，我们需要从开始到结尾去遍历整个页面然后才能获取到我们所需要记录，时间复杂度也就是 O(n)。此时我们引入分组的概念，并记录每个分组中主键最大记录的位于当前页的偏移量，采用二分法的形式，每次获取到一个分组中最大的记录的主键，然后与查询条件主键进行比较，从而快速的定位到所在的分组后，再按照单向链表找到指定的主键对应的记录。这样查询效率迅速提升，时间复杂度就是 O（logm）这里的m也就是分组的个数。

这里也就引出了Page Directory的作用。

Page Directory

Page Directory 可以理解为对 UserRecord 中的数据建立的目录。对应着 User Record中记录的分组信息。Page Directory中存储着多个 slot，也就是槽，每一个槽也就记录着分组中主键最大记录位于当前页的偏移量，能够快速定位到指定的记录。

多个数据页之间的关系

现在我们分析完了单个数据页的结构，并对InnoDB针对单个数据页进行查询优化做了简单的介绍，那么当存储的数据过多而有多个数据页时InnoDB又是如何处理的呢？

这里我们对数据页中 File Header 简单说下， File Header中记录了当前数据页的上一个页的地址和下一个页的地址，简单来说，页与页之间是一个双向链表。

根据双向链表，当我们在多个页之间根据主键查询某条记录时，按照顺序去在每个页面里面去查找，效率比较低。此时考虑多个页面中是否存在类似于单个页面中分组的概念，能够快速定位到记录对应的页呢？

此时我们引出了存储目录信息的数据页，而不是存储真实用户数据的的数据页。

存储目录信息的数据页

这里的目录信息就是包含其他数据页的页码信息（根据页码信息方便定位到对应的数据页）以及对应数据页中最小主键的值的记录。

在InnoDB中，不管是存储目录的数据页其实还是存储真实数据的数据页是一个概念，它们拥有完全一致的页结构，不用之处在于 UserRecord存储的真实内容不同，在User Record中的记录有一个字段专门记录当前记录存储的是页面信息还是真实用户数据。

这里我们依据存储目录信息的数据页来模拟根据主键进行查询。

如图所示：