7. CHECKPOINTS DURING RESTART 重启时构建checkpoint
在本章节中,我们会讨论:如何在重启过程中的不同阶段执行checkpoint,从而可以减少对CPU和IO的负载。
分析遍历
在分析遍历结束后执行checkpoint,这样在恢复的失败的话,可以节省一部分工作。checkpoint中事务表要和分析遍历完成时的事务表一致。checkpoint的脏页列表要和分析遍历的脏页表一致。对于后者,脏页列表取自于缓存池(BP)脏页表。
Redo遍历
在redo遍历之初,将会通知缓存管理(BM),在遍历时,当它刷出页数据到非易失存储上时,它会变更脏页表使其RecLSN为该日志记录的LSN,这样到此日志记录的所有日志都会被处理。如果BM以这种方式管理重启脏页表就足够了,BM在正常流程时不需要维护自己的脏页表。当然,它仍需要跟踪当前处于缓存中的页。在redo遍历时,可以在任意时刻执行checkpoint。如果在遍历结束前系统崩溃,可以减少下次需要redo的日志量。checkpoint的脏页列表和此时checkpoint的重启脏页表一致。该checkpoint的事务表和分析遍历结束时的事务表一致。建立checkpoint,并不会受并发redo遍历的影响。
undo遍历
在undo遍历之初,重启脏页表变成BP脏页表。此时,将不在缓存中的页移除来清空该表。接着,BP管理模块像正常流程一样维护该表--当页写入非易失存储时移除该页,当页变成脏页时添加该页。在遍历时,事务表也像正常流程一样维护。如果在遍历的任意时刻执行checkpoint,那么checkpoint中的脏页列表要和此时的BP脏页表一致。该checkpoint的事务表要和此时的事务表一致。
在System R中,在重启恢复时,有时需要执行checkpoint来释放一些物理页(影子页)来执行更多的undo或redo。这也是System R没法重演历史的另一个原因。这使得重启逻辑变得复杂了,当执行了一个重启checkpoint,该逻辑也不再像图17描述的那样了。该重启checkpoint逻辑及其对重启流程的影响过于复杂,将会在【31】中详细讨论。ARIES在重启时允许早期的checkpoint。在我们的例子中,checkpoint是可有可无的,但是system R中是必须要有的。