MySQL 存储引擎深度解析

一、InnoDB 架构

1.1 MySQL 的数据是存放在哪的

⭐ibdata1 共享表空间

需要注意的是表的数据可以存储在共享表空间里面也可以存储在独占表空间里面，这个参数由 innodb_file_per_table 控制默认是开启的。不过实际上这个 ibdata1 文件还是存在的。

原理说明

如果启用了 innodb_file_per_table 参数，需要注意的是每张表的表空间内存放的只是数据、索引和插入缓冲 Bitmap 页，其他数据如: 回滚信息、插入缓冲索引页、系统事物信息、二次写缓冲（Double write buffer）等还是放在原来的共享表空间内。同时说明了一个问题: 即使启用了 innodb_file_per_table 参数共享表空间 ibdata1 还是会不断的增加其大小的

数据库空间占用来源

数据库主要的空间占用来源于哪两部分。这里，我们还是针对 MySQL 中应用最广泛的 InnoDB 引擎展开讨论。

一个 InnoDB 表包含两部分，即：表结构定义和数据。

在 MySQL 8.0 版本以前，表结构是存在以.frm 为后缀的文件里
而 MySQL 8.0 版本，则已经允许把表结构定义放在系统数据表中了

因为表结构定义占用的空间很小，所以我们今天主要讨论的是表数据。

表数据存储方式

表数据既可以存在共享表空间里，也可以是单独的文件。这个行为是由参数 innodb_file_per_table 控制的：

这个参数设置为 OFF 表示的是，表的数据放在系统共享表空间，也就是跟数据字典放在一起
这个参数设置为 ON 表示的是，每个 InnoDB 表数据存储在一个以 .ibd 为后缀的文件中

从 MySQL 5.6.6 版本开始，它的默认值就是 ON 了。

推荐配置

我建议你不论使用 MySQL 的哪个版本，都将这个值设置为 ON。因为，一个表单独存储为一个文件更容易管理，而且在你不需要这个表的时候，通过 drop table 命令，系统就会直接删除这个文件。而如果是放在共享表空间中，即使表删掉了，空间也是不会回收的。

所以，将 innodb_file_per_table 设置为 ON，是推荐做法，我们接下来的讨论都是基于这个设置展开的。

MySQL 8 的存储文件

InnoDB 的存储主要是靠两个文件，分别是 .frm .ibd。不过注意的是，这个 .frm 在 MySQL 8 里不存在了，而是合并在了 .ibd 文件中的 SDI 里面了。

使用 ibd2sdi --dump-file=emp.txt emp.ibd 指令就可以看到详细的表信息了。

具体可以使用 show global variables like '%datadir%'; 得到数据实际存储的位置 C:\ProgramData\MySQL\MySQL Server 8.0\Data\

二、表空间、页结构、行格式

2.1 表空间的底层结构

表

表空间，表示一本书，段表示书中的章节，区表示每章节的小节，页表示书的每一页，行就是每页的每行数据。

结构关系

表空间里有多个段
一个段包含 256 个区
一个区包含 64 个页
一个页为 16K

段

段，表空间由多个段组成，段是由多个区组成的，具体分为三种段：

数据段 - 存放 B+ 树非叶子节点的区的集合
索引段 - 存放 B+ 树叶子节点的区的集合
回滚段 - 存放的是回滚数据区的集合，这里会配合 MVCC 机制实现多版本查询数据

⭐区

区，为了使用顺序 IO 避免磁盘随机 IO 的速度太慢，会按照区为单位划分空间。

每个区的大小为 1M 也就是 64 个页 (64 * 16)，使 B+ 树每一层的双向链表的节点页，相邻的页的物理位置也相邻，从而使用顺序 IO

⭐页

页，记录数据是一行一行的记录的，但是为了提升 IO 的效率（局部性原理），我们会选择以页为单位读取数据，默认每个页的大小是 16KB。

重要特性

记住是读和写都是以页为基本单位的
内存 -> 磁盘，内存 <- 磁盘都是以页为单位进行的
在磁盘层面的话就是用 B+ 树来维护的

2.2 页的内部结构

页的组成部分

FileHeader（38byte）

表示当前页的上一个数据页的位置和当前页的下一个数据页的位置（其实就是双向链表的上一个和下一个节点)

Infimun+SupremunRecord（下界，上界记录）

便于我们后面进行二分操作
下界是比该数据页中主键最小的值还小的值，上界同理

User Record

存储实际的记录的内容，也就是一行行记录

FreeSpace

其实就是空闲空间，记录被删除之后也会加入到FreeSpace中

FileTrailer（8byte）

用于校验数据页是否完整用的，一般这种最小调用数据单元都有这种用于校验的部分，TCP就有

补充说明

FileHeader存储着两个指针分别指向pre和next形成双向链表
FileTrailer是用于校验我们读取到的数据页是不是完整的
PageHeader主要是记录各种元数据，存储各种状态信息，比如第一个标记为删除的记录的地址PAGE_FREE，页目录中槽的数量 PAGE_N_DIR_SLOTS，还未使用的空间最小地址PAGE_HEAP_TOP