MySQL深入20-这么保证数据不丢

# MySQL深入20-这么保证数据不丢

只要redo log和bin log保证持久化到磁盘，就能确保MySQL异常重启后，数据可以恢复。本文就对redo log和bin log写入流程进行详情分析。

bin log的写入逻辑：事务执行过程中，先把日志写到binlog cache，事务提交的时候，再把bin log cache写到bin log文件中。

一个事务的binlog是不能被拆开的，因此无论这个事务多大，也要确保一次性写入。

系统给每个线程分配了一片binlog cache内存。参数 binlog_cache_size 用于控制单个线程内 binlog cache 所占内存的大小。如果超过了这个参数规定的大小，就要暂存到磁盘。

事务提交的时候，执行器把binlog cache里完整的事务写入binlog中，并清空binlog cache。

由上图可以看到每个线程有自己binlog cache，但是共用同一份binlog文件：

write和fsync的时机，是由参数sync_binlog控制的：

因此在IO瓶颈的场景里，将 sync_binlog 设置成一个比较大的值，可以提升性能。但是也存在一个问题，如果主机发生异常重启，那么会丢失最近N个事务的binlog日志。

事务在执行过程中，生成的redo log是要先写到redo log buffer的。但是redo log并非每次生成后要直接持久化到磁盘。

如果事务执行期间 MySQL 发生异常重启，那这部分日志就丢了。由于事务并没有提交，所以这时日志丢了也不会有损失。

但是在事务还没提交的时候，redo log buffer中的部分日志是有可能被持久化到磁盘的。

那么日志写到 redo log buffer 是很快的，wirte 到 page cache 也差不多，但是持久化到磁盘的速度就慢多了。

redo log的写入策略是由innodb_flush_log_at_trx_commit参数进行设置的：

设置为 0 的时候，表示每次事务提交时都只是把 redo log 留在 redo log buffer 中 ;该策略不管是主机掉电还是MySQL异常重启，都有丢数据的风险，风险高，但是写入快
设置为 1 的时候，表示每次事务提交时都将 redo log 直接持久化到磁盘；该策略直接写到磁盘，没有丢数据的风险，风险低，但是写入慢。
设置为 2 的时候，表示每次事务提交时都只是把 redo log 写到 page cache。该策略主机掉电后会丢数据，但是MySQL异常重启不会丢数据，风险较低，写入比较快。

InnoDB 有一个后台线程，每隔 1 秒，就会把 redo log buffer 中的日志，调用 write 写到文件系统的 page cache，然后调用 fsync 持久化到磁盘。

这里和与binlog不同，binlog是每个线程都有一个binlog cache，而redo log是多个线程共用一个redo log buffer。

事务执行过程中的redo log也是直接写在redo log buffer中的，这些 redo log 也会被后台线程一起持久化到磁盘。

实际上，除了后台线程每秒一次的轮训操作，还有两种场景会让一个没有提交的事务redo log写入到磁盘中。

redo log buffer 占用的空间即将达到 innodb_log_buffer_size 一半的时候，后台线程会主动写盘。注意，由于这个事务并没有提交，所以这个写盘动作只是 write，而没有调用 fsync，也就是只留在了文件系统的 page cache。
并行的事务提交的时候，顺带将这个事务的redo log buffer持久化到磁盘。假设一个事务A执行了一半，写了一半redo log 到 buffer 中，这时候有另外一个线程的事务 B 提交，如果 innodb_flush_log_at_trx_commit 设置的是 1，那么按照这个参数的逻辑，事务 B 要把 redo log buffer 里的日志全部持久化到磁盘。这时候就会带上事务A在redo log buffer里的日志一起持久化到磁盘。