本文共 5982 字,大约阅读时间需要 19 分钟。
InnoDB有两个非常重要的日志,undo log 和 redo log;通过undo log可以看到数据较早版本,实现MVCC,或回滚事务等功能;redo log用来保证事务持久性
本文以一条insert语句为线索介绍 mini transaction
mini transation 主要用于innodb redo log 和 undo log写入,保证两种日志的ACID特性
mini-transaction遵循以下三个协议:
The FIX Rules
Write-Ahead Log
Force-log-at-commit
修改一个页需要获得该页的x-latch
访问一个页是需要获得该页的s-latch或者x-latch
持有该页的latch直到修改或者访问该页的操作完成
持久化一个数据页之前,必须先将内存中相应的日志页持久化
每个页有一个LSN,每次页修改需要维护这个LSN,当一个页需要写入到持久化设备时,要求内存中小于该页LSN的日志先写入到持久化设备中
一个事务可以同时修改了多个页,Write-AheadLog单个数据页的一致性,无法保证事务的持久性
Force -log-at-commit要求当一个事务提交时,其产生所有的mini-transaction日志必须刷到持久设备中
这样即使在页数据刷盘的时候宕机,也可以通过日志进行redo恢复
本文使用 MySQL 5.6.16 版本进行分析
mini transation 相关代码路径位于 storage/innobase/mtr/ 主要有 mtr0mtr.cc 和 mtr0log.cc 两个文件
另有部分代码在 storage/innobase/include/ 文件名以 mtr0 开头
mini transaction 的信息保存在结构体 mtr_t 中,结构体成员描述如下
成员属性 | 描述 |
---|---|
state | mini transaction所处状态 MTR_ACTIVE, MTR_COMMITTING, MTR_COMMITTED |
memo | mtr 持有锁的栈 |
log | mtr产生的日志 |
inside_ibuf | insert buffer 是否修改 |
modifications | 是否修改buffer pool pages |
made_dirty | 是否产生buffer pool脏页 |
n_log_recs | log 记录数 |
n_freed_pages | 释放page数 |
log_mode | 日志模式,默认MTR_LOG_ALL |
start_lsn | lsn 起始值 |
end_lsn | lsn 结束值 |
magic_n | 魔术字 |
一个 mini transaction 从 mtr_start(mtr)开始,到 mtr_commit(mtr)结束
下面涉及 mtr 的嵌套,在代码中,每个 mtr_t 对象变量名都叫 mtr,本文中为了区分不同 mtr,给不同的对象加编号
下面一般省略 mtr_t 以外的参数
第一个 mtr 从 row_ins_clust_index_entry_low 开始
mtr_start(mtr_1) // mtr_1 贯穿整条insert语句row_ins_clust_index_entry_lowmtr_s_lock(dict_index_get_lock(index), mtr_1) // 对index加s锁btr_cur_search_to_nth_levelrow_ins_clust_index_entry_lowmtr_memo_push(mtr_1) // buffer RW_NO_LATCH 入栈buf_page_get_genbtr_cur_search_to_nth_levelrow_ins_clust_index_entry_lowmtr_memo_push(mtr_1) // page RW_X_LATCH 入栈buf_page_get_genbtr_block_get_funcbtr_cur_latch_leavesbtr_cur_search_to_nth_levelrow_ins_clust_index_entry_low mtr_start(mtr_2) // mtr_2 用于记录 undo log trx_undo_report_row_operation btr_cur_ins_lock_and_undo btr_cur_optimistic_insert row_ins_clust_index_entry_low mtr_start(mtr_3) // mtr_3 分配或复用一个 undo log trx_undo_assign_undo trx_undo_report_row_operation btr_cur_ins_lock_and_undo btr_cur_optimistic_insert row_ins_clust_index_entry_low mtr_memo_push(mtr_3) // 对复用(也可能是分配)的 undo log page 加 RW_X_LATCH 入栈 buf_page_get_gen trx_undo_page_get trx_undo_reuse_cached // 这里先尝试复用,如果复用失败,则分配新的 undo log trx_undo_assign_undo trx_undo_report_row_operation trx_undo_insert_header_reuse(mtr_3) // 写 undo log header trx_undo_reuse_cached trx_undo_assign_undo trx_undo_report_row_operation trx_undo_header_add_space_for_xid(mtr_3) // 在 undo header 中预留 XID 空间 trx_undo_reuse_cached trx_undo_assign_undo trx_undo_report_row_operation mtr_commit(mtr_3) // 提交 mtr_3 trx_undo_assign_undo trx_undo_report_row_operation btr_cur_ins_lock_and_undo btr_cur_optimistic_insert row_ins_clust_index_entry_low mtr_memo_push(mtr_2) // 即将写入的 undo log page 加 RW_X_LATCH 入栈 buf_page_get_gen trx_undo_report_row_operation btr_cur_ins_lock_and_undo btr_cur_optimistic_insert row_ins_clust_index_entry_low trx_undo_page_report_insert(mtr_2) // undo log 记录 insert 操作 trx_undo_report_row_operation btr_cur_ins_lock_and_undo btr_cur_optimistic_insert row_ins_clust_index_entry_low mtr_commit(mtr_2) // 提交 mtr_2 trx_undo_report_row_operation btr_cur_ins_lock_and_undo btr_cur_optimistic_insert row_ins_clust_index_entry_low /* mtr_2 提交后开始执行 insert 操作 page_cur_insert_rec_low 具体执行 insert 操作 在该函数末尾调用 page_cur_insert_rec_write_log 写 redo log*/page_cur_insert_rec_write_log(mtr_1) // insert 操作写 redo logpage_cur_insert_rec_lowpage_cur_tuple_insertbtr_cur_optimistic_insertmtr_commit(mtr_1) // 提交 mtr_1row_ins_clust_index_entry_low
至此 insert 语句执行结束后
一条 insert 是一个单语句事务,事务提交时也会涉及 mini transaction
提交事务时,第一个 mtr 从 trx_prepare 开始
mtr_start(mtr_4) // mtr_4 用于 prepare transactiontrx_preparetrx_prepare_for_mysqlinnobase_xa_prepareha_prepare_lowMYSQL_BIN_LOG::prepareha_commit_transtrans_commit_stmtmysql_execute_commandmtr_memo_push(mtr_4) // undo page 加 RW_X_LATCH 入栈buf_page_get_gentrx_undo_page_gettrx_undo_set_state_at_preparetrx_preparemlog_write_ulint(seg_hdr + TRX_UNDO_STATE, undo->state, MLOG_2BYTES, mtr_4) 写入TRX_UNDO_STATEtrx_undo_set_state_at_preparetrx_preparemlog_write_ulint(undo_header + TRX_UNDO_XID_EXISTS, TRUE, MLOG_1BYTE, mtr_4) 写入 TRX_UNDO_XID_EXISTStrx_undo_set_state_at_preparetrx_preparetrx_undo_write_xid(undo_header, &undo->xid, mtr_4) undo 写入 xidtrx_undo_set_state_at_preparetrx_preparemtr_commit(mtr_4) // 提交 mtr_4trx_preparemtr_start(mtr_5) // mtr_5 用于 commit transactiontrx_committrx_commit_for_mysqlinnobase_commit_lowinnobase_commitha_commit_lowMYSQL_BIN_LOG::process_commit_stage_queueMYSQL_BIN_LOG::ordered_commitMYSQL_BIN_LOG::commitha_commit_transtrans_commit_stmtmysql_execute_commandmtr_memo_push(mtr_5) // undo page 加 RW_X_LATCH 入栈buf_page_get_gentrx_undo_page_gettrx_undo_set_state_at_finishtrx_write_serialisation_historytrx_commit_lowtrx_committrx_undo_set_state_at_finish(mtr_5) // set undo state, 这里是 TRX_UNDO_CACHEDtrx_write_serialisation_historytrx_commit_lowtrx_commitmtr_memo_push(mtr_5) // 系统表空间 transaction system header page 加 RW_X_LATCH 入栈buf_page_get_gentrx_sysf_gettrx_sys_update_mysql_binlog_offsettrx_write_serialisation_historytrx_commit_lowtrx_committrx_sys_update_mysql_binlog_offset // 更新偏移量信息到系统表空间trx_write_serialisation_historytrx_commit_lowtrx_commitmtr_commit(mtr_5) // 提交 mtr_5trx_commit_lowtrx_commit
至此 insert 语句涉及的 mini transaction 全部结束
上面可以看到加锁、写日志到 mlog 等操作在 mini transaction 过程中进行
解锁、把日志刷盘等操作全部在 mtr_commit 中进行,和事务类似
mini transaction 没有回滚操作, 因为只有在 mtr_commit 才将修改落盘,如果宕机,内存丢失,无需回滚;如果落盘过程中宕机,崩溃恢复时可以看出落盘过程不完整,丢弃这部分修改
mtr_commit 主要包含以下步骤
上面的步骤 1. 中,日志刷盘策略和 innodb_flush_log_at_trx_commit 有关
转载地址:http://cvmpa.baihongyu.com/