原创

深入理解MySQL中的bin log、redo log、undo log

温馨提示:
本文最后更新于 2024年04月28日,已超过 269 天没有更新。若文章内的图片失效(无法正常加载),请留言反馈或直接联系我

bin log(二进制日志)

什么是bin log?

记录数据库执行的写入性操作信息,以二进制的形式保存在磁盘中。

由服务层产生,所有储存引擎都支持。

bin log属于逻辑日志。

bin log日志有三种格式:STATMENT、ROW、MIXED。MySQL5.7.7之后默认是ROW。

简单普及一下逻辑日志和物理日志:

  • 逻辑日志:记录的sql语句。
  • 物理日志:记录的数据页变更。

bin log的使用场景?

  • 主从复制:在master端开启bin log,然后master将bin log发送到每个slave端,slave端重放bin log从而达到主从数据一致。

    简单画个图来理解一下MySQL的主从复制流程:

    1. master在准备提交事务之前,将变更记录到bin log中。
    2. slave启动一个IO线程来读取bin log中的事件,并记录到自己的ready log(中继日志)中。
    3. 同时slave还会启动一个SQL线程,读取ready log中的事件在备库中执行,从而实现备库的数据更新。
  • 数据恢复:通过使用mysqlbinlog工具来恢复数据。

  • 增量备份

如何开启bin log?

# 查看是否开启bin log,这里可以看到没有开启
mysql> show variables like '%log_bin%';
+---------------------------------+-------+
| Variable_name                   | Value |
+---------------------------------+-------+
| log_bin                         | OFF   |
| log_bin_basename                |       |
| log_bin_index                   |       |
| log_bin_trust_function_creators | OFF   |
| log_bin_use_v1_row_events       | OFF   |
| sql_log_bin                     | ON    |
+---------------------------------+-------+
6 rows in set (0.05 sec)

# 查看当前MySQL版本
mysql> select version();
+-----------+
| version() |
+-----------+
| 5.7.36    |
+-----------+
1 row in set (0.20 sec)

# 确认已开启bin log
mysql> show variables like '%log_bin%';
+---------------------------------+-----------------------------+
| Variable_name                   | Value                       |
+---------------------------------+-----------------------------+
| log_bin                         | ON                          |
| log_bin_basename                | /var/lib/mysql/binlog       |
| log_bin_index                   | /var/lib/mysql/binlog.index |
| log_bin_trust_function_creators | OFF                         |
| log_bin_use_v1_row_events       | OFF                         |
| sql_log_bin                     | ON                          |
+---------------------------------+-----------------------------+
6 rows in set (0.03 sec)

如果没有开启,编辑/etc/my.cnf文件,添加以下配置:

# 开启bin log日志
log-bin=binlog
# 配置server-id
server-id=1

如何查看以及修改每个bin log文件大小最大值?

查看本机的bin log文件大小最大值,可以看到是1073741824字节,也就是1G。

mysql> show variables like 'max_binlog_size';
+-----------------+------------+
| Variable_name   | Value      |
+-----------------+------------+
| max_binlog_size | 1073741824 |
+-----------------+------------+
1 row in set (0.00 sec)

添加或修改MySQL的my.cnf文件:

max_binlog_size=2G

如何使用bin log恢复数据?

# 查看当前bin log位置
mysql> show master status;

# 也可以刷新日志,方便后面筛选
mysql> flush logs;

# 查看二进制日志列表
mysql> show binary logs;

bin log恢复数据:

# 根据事件位置恢复(--start-position是开始位置,--stop-position是结束位置)
mysqlbinlog --start-position=16275 --stop-position=16566 --database=just-test /var/lib/mysql/binlog.000004 | mysql -uroot -p123456
# 根据指定时间恢复(--start-datetime是开始时间,--stop-datetime是结束时间)
mysqlbinlog --start-datetime="2022-02-17 12:00:00" --stop-datetime="2022-02-17 18:00:00" --database=just-test /var/lib/mysql/binlog.000004 | mysql -uroot -p123456

# --database是指定只恢复just-test数据库,/var/lib/mysql/binlog.000004是binlog日志文件路径

bin log日志解码以及导出到服务器中:

mysqlbinlog -vvv --base64-output=decode-rows --start-position=154 --stop-position=2150 --database=just-test /var/lib/mysql/binlog.000001 > /just-test.sql | mysql -uroot -p123456 -f

-vvv:显示出执行的SQL以及binlog_rows_query_log_events参数。

--base64-output=decode-rows:如果bin log为row格式必须使用该选项对日志进行解析,恢复数据时不能加该选项。

简单演示一下如何恢复被删掉的数据:

# 快速创建一个极其简单的数据表来用于测试
mysql> CREATE TABLE `quick-test-data` (
  `id` bigint(20) DEFAULT NULL,
  `name` varchar(100) COLLATE utf8mb4_unicode_ci DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

# 分别插入小明和小花两条数据
mysql> INSERT INTO `quick-test-data` (`id`, `name`) VALUES (1, '小明');
mysql> INSERT INTO `quick-test-data` (`id`, `name`) VALUES (2, '小花');
mysql> INSERT * FROM `quick-test-data`;
+------+--------+
| id   | name   |
+------+--------+
|    1 | 小明   |
|    2 | 小花   |
+------+--------+

# 删掉小花
mysql> DELETE FROM `quick-test-data` WHERE `id` = 2
mysql> INSERT * FROM `quick-test-data`;
+------+--------+
| id   | name   |
+------+--------+
|    1 | 小明   |
+------+--------+

# 查看bin log日志,确定从哪里开始恢复(数据比较多,我在此抽取一部分,binlog.000004是刷新几次之后的日志文件,根据自己实际情况来)
mysql> show binlog events in 'binlog.000004';
+---------------+-------+----------------+-----------+-------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Log_name      | Pos   | Event_type     | Server_id | End_log_pos | Info                                                                                                                                                                                                                     |
+---------------+-------+----------------+-----------+-------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| binlog.000004 | 15636 | Anonymous_Gtid |         1 |       15701 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS'                                                                                                                                                                                     |
| binlog.000004 | 15701 | Query          |         1 |       15984 | use `just-test`; CREATE TABLE `just-test`.`quick-test-data`  (
  `id` bigint NULL,
  `name` varchar(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NULL
) CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci |
| binlog.000004 | 15984 | Anonymous_Gtid |         1 |       16049 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS'                                                                                                                                                                                     |
| binlog.000004 | 16049 | Query          |         1 |       16126 | BEGIN                                                                                                                                                                                                                    |
| binlog.000004 | 16126 | Table_map      |         1 |       16192 | table_id: 116 (just-test.quick-test-data)                                                                                                                                                                                |
| binlog.000004 | 16192 | Write_rows     |         1 |       16244 | table_id: 116 flags: STMT_END_F                                                                                                                                                                                          |
| binlog.000004 | 16244 | Xid            |         1 |       16275 | COMMIT /* xid=1088 */                                                                                                                                                                                                    |
| binlog.000004 | 16275 | Anonymous_Gtid |         1 |       16340 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS'                                                                                                                                                                                     |
| binlog.000004 | 16340 | Query          |         1 |       16417 | BEGIN                                                                                                                                                                                                                    |
| binlog.000004 | 16417 | Table_map      |         1 |       16483 | table_id: 116 (just-test.quick-test-data)                                                                                                                                                                                |
| binlog.000004 | 16483 | Write_rows     |         1 |       16535 | table_id: 116 flags: STMT_END_F                                                                                                                                                                                          |
| binlog.000004 | 16535 | Xid            |         1 |       16566 | COMMIT /* xid=1091 */                                                                                                                                                                                                    |
| binlog.000004 | 16566 | Anonymous_Gtid |         1 |       16631 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS'                                                                                                                                                                                     |
| binlog.000004 | 16631 | Query          |         1 |       16708 | BEGIN                                                                                                                                                                                                                    |
| binlog.000004 | 16708 | Table_map      |         1 |       16774 | table_id: 116 (just-test.quick-test-data)                                                                                                                                                                                |
| binlog.000004 | 16774 | Delete_rows    |         1 |       16826 | table_id: 116 flags: STMT_END_F                                                                                                                                                                                          |
| binlog.000004 | 16826 | Xid            |         1 |       16857 | COMMIT /* xid=1094 */                                                                                                                                                                                                    |
+---------------+-------+----------------+-----------+-------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

### 分析此处的bin log日志 ###
# 15701~15984:建表quick-test-data
# 15984~16275:插入第一条数据,即小明
# 16275~16566:插入第二条数据,即小花
# 16566~16857:删除小花
## 所以,因为数据表和小明都是存在的,所以,我们的start-position应该是16275,stop-position应该是16566
## 16566~16857这里是删除小花的,所以,这个部分不能被包括进来,不然恢复之后又被删除掉了

# 使用mysqlbinlog工具恢复被删除的小花数据
# 在Linux命令行执行(注意不是在mysql命令行)
[root@lzhpo-light ~]# mysqlbinlog --start-position=16275 --stop-position=16566 --database=just-test /var/lib/mysql/binlog.000004 | mysql -uroot -p123456

# 恢复之后的数据表
mysql> select * from `quick-test-data`;
+------+--------+
| id   | name   |
+------+--------+
|    1 | 小明   |
|    2 | 小花   |
+------+--------+

如何正确删除bin log日志?

  • reset master命令:虽然可以清空所有bin log文件,但是会导致从库异常,主从架构下无法使用。

  • expire_logs_days变量:通过该变量可以指定自动删除日期,如果日志过多,在删除时会有IO过高问题,可能导致性能抖动。

  • purge命令:推荐方法,可以快速删除指定bin log。

    # 删除bin log到指定的文件为止
    mysql> PURGE MASTER LOGS TO 'binlog.000004'
    
    # 删除指定日期之前的文件
    mysql> PURGE MASTER LOGS BEFORE '2022-02-18 18:30:00'
    

redo log(重做日志)

什么是redo log?

简单一句话:redo log就是记录数据页的变更

redo log由InnoDB的存储引擎层产生,是InnoDB 存储引擎特有的。

redo log属于物理日志,因为,它记录的是数据页的变更。

因为,这种改变记录不是说一定要全部保存下来,所以,redo log采用的是大小固定,循环写入的方式,当从开头开始写到结尾的时候,又会回到开头继续写日志。

redo log记录日志的方式(原理)?

emm…图丑,但能帮助理解就好。

InnoDB的redo log文件大小是固定的,假设我这里redo log大小为4G,并且我划分为4个部分,redo log就会从ib_logfile_0开始写ib_logfile_1ib_logfile_2ib_logfile_3,直到4个部分都写满为止,再重新回到第一个部分ib_logfile_0开始写。

write position:当前记录的LSN(Log Sequence Number,日志序列号)位置。一边写,一边顺时针移动(向前移动)。

check point:当前数据页更改记录刷盘之后所处的LSN(Log Sequence Number,日志序列号)位置。一边写,一边顺时针移动(向前移动)。

check pointwrite position部分就是待落盘的数据页更改记录。

write positioncheck point部分就是redo log空闲的部分,用来记录新的操作日志。

write position追上check point的时候,会先推动check point顺时针移动(向前移动),等到有空闲的redo log位置的时候再记录新的操作日志。

redo log如何进行异常崩溃数据恢复的?

每当启动InnoDB的时候,不管上次是正常关闭还是异常关闭,都会进行恢复操作。

因为redo log记录的是数据页的物理变化,因此恢复的时候速度比逻辑日志(如bin log)要快很多。

在此,我画一个简单的流程图方便理解

还有一种比较特殊的情况,数据页LSN也会大于日志LSN:

当宕机的时候,正在处理check point刷盘过程,且数据页的刷盘进度超过了日志页的刷盘进度,此时,也会出现数据页LSN也会大于日志LSN的情况。
这种情况的话,数据页剩下的这点redo log日志将不会重做,会正常启动。

如何查看以及修改redo log的大小?

mysql> show variables like 'innodb_log%';
+------------------------------------+----------+
| Variable_name                      | Value    |
+------------------------------------+----------+
| innodb_log_buffer_size             | 16777216 |
| innodb_log_checksums               | ON       |
| innodb_log_compressed_pages        | ON       |
| innodb_log_file_size               | 50331648 |
| innodb_log_files_in_group          | 2        |
| innodb_log_group_home_dir          | ./       |
| innodb_log_spin_cpu_abs_lwm        | 80       |
| innodb_log_spin_cpu_pct_hwm        | 50       |
| innodb_log_wait_for_flush_spin_hwm | 400      |
| innodb_log_write_ahead_size        | 8192     |
| innodb_log_writer_threads          | ON       |
+------------------------------------+----------+
11 rows in set (0.00 sec)

innodb_log_file_size就是redo log文件大小,50331648字节,也就是48MB。

要修改的话,打开MySQL的my.cnf文件,添加或编辑配置,比如,我修改为1G:

innodb_log_file_size=1G

如何自定义在事务提交的时候将log buffer中的日志刷入log file中的时机?

可以通过配置innodb_flush_log_at_trx_commit参数来更改刷入时机。

查看当前MySQL的配置时机:

mysql> show variables like 'innodb_flush_log_at_trx_commit';
+--------------------------------+-------+
| Variable_name                  | Value |
+--------------------------------+-------+
| innodb_flush_log_at_trx_commit | 1     |
+--------------------------------+-------+
1 row in set (0.00 sec)

参数值解释:

  • 0:延迟写,延迟刷。
    事务提交的的时候不会将redo log buffer中的日志写入到os buffer,而是每秒写入os buffer并调用fsync()写入到redo log file中。
    这样子可能会导致,当系统崩溃,可能丢失1秒的数据。

  • 1:实时写,实时刷。
    事务每次提交都会将redo log buffer中的日志写入os buffer并调用fsync()刷到redo log file中。
    这种方式即使系统崩溃也不会丢失任何数据,但是因为每次提交都写入磁盘,IO的性能较差。

  • 2:实时写,延迟刷。
    事务每次提交都仅写入到os buffer,然后是每秒调用fsync()os buffer中的日志写入到redo log file

undo log(回滚日志)

什么是undo log?

MySQL(存储引擎需要能支持事务)在修改记录之前(提交事务之前),会把原先记录的值先保存起来(也就是写入到undo log),然后再修改(提交事务),当出问题的时候MySQL可以利用undo log来回滚事务,即恢复原先的记录值。

undo log由InnoDB的存储引擎层产生,是InnoDB 存储引擎特有的(和redo log一样)。

undo log属于逻辑日志。

MySQL的事务四大特性:原子性、隔离性、持久性、一致性。其中,原子性的底层就是靠undo log实现的。

undo log的作用?

1.事务回滚

前面我们说到,当出问题需要回滚事务的时候,可以利用MySQL的undo log来回滚事务,以保证事务的一致性。

比如:执行一条delete语句:

DELETE FROM sys_log WHERE id = 1;

undo log就会记录一条与它相反的日志,即记录它的insert语句。

update语句也是同理,记录与它相反的update语句。

执行一条update语句:

# 假设,之前username是小花
UPDATE sys_user SET username = '小明' WHERE id = 1;

undo log就会记录与它相反的update语句:

UPDATE sys_user SET username = '小花' WHERE id = 1;

2.多版本控制(MVCC)

MVCC全称即Multi-Version Concurrency Control。

在MySQL的InnoDB存储引擎中,就是用undo log来实现MVCC的。

举个例子,当我们读取的某一行被其它事务锁定的时候,InnoDB可以从undo log中分析出该记录历史版本的数据,从而让我们可以读取到当前事务操作之前的数据(也就是快照读)。

普及一下快照读和当前读:

  • 快照读:读取的历史版本数据,不会加锁。
    普通的select就是快照读。

  • 当前读:读取的是最新版本, 会对读取的记录加锁, 以保证其它事务无法对此记录进行变更,保证安全性。
    属于当前读的:update、delete、insert、select … for update、select … lock in share mode(共享读锁)等等。

undo log的工作机制?

在MySQL的InnoDB存储引擎中,undo log是采用分段(segment)的方式保存的,简单来说,就是一种命名为rollback segment的回滚段,每个回滚段中有1024个undo log segment。

在MySQL5.5之后,能支持128个回滚段,也就是能支持128*1024个undo log segment,在此之前是只支持1个回滚段,也就是1024个undo log segment。

undo log工作原理?

在此,简单画一张图来理解一下:

  1. 事务A提交之前,会备份之前的数据到对应的undo buffer,然后undo log保存之前的记录数据,然后再将最新的数据持久化到ibd文件。
  2. 此时事务B查询,直接读取undo buffer缓存,因为这时候事务A还没提交且它需要回滚事务,所以,这时候事务B是不读取磁盘的,是直接从undo buffer缓存中读取。

参考文章:
https://www.linuxe.cn/post-393.html
https://juejin.cn/post/6860252224930070536
https://blog.csdn.net/Weixiaohuai/article/details/117867353

本文目录