PG的多版本并发控制(三)

太阳3年前 (2023-04-27)技术文章1970

三、多版本并发控制

3.1 常见多版本并发的实现方式

第一种方式是，数据库仅保存最新版本数据，将发生变更的旧行版本数据写到其他地方如undo，当需要读取旧版本数据时，通过undo重构。oracle和MySQL就是通过undo的方式实现。

第二种方式是，数据库保存所有行版本数据，当需要读取旧版本数据时直接读取即可，数据库通过一定的机制定时回收无限的行版本数据释放物理空间。postgres数据库就是通过该方式实现，SQL Server使用的方式也类似这种方式，不过它会将旧版本数据保存在tmpdb中。

3.2 PG多版本并发控制实现原理

Postgres数据库保留旧版本数据在数据文件中，也就是对于delete操作pg数据库并不会将该记录行进行物理删除，而仅仅是做了一个删除打标而已，且每个数据行中额外存储xmin、xmax、ctid的系统信息。
每条语句执行是都会去查看当前事务的事务快照信息，事务快照反应了当前并发事务中所有活跃与非活跃的事务ID信息
clog记录了所有事务的事务状态
PG数据库根据tuple的xmin、xmax、当前的事务快照信息、clog事务状态、以及当前隔离级别，根据一定的规则确定对应tuple是否可见，其规则相对比较复杂，具体信息可见：http://www.interdb.jp/pg/pgsql05.html 中 5.6. Visibility Check Rules

3.3 PG并发版本控制所必要的一些维护操作

旧版本数据需要清理，旧版本数据一定程度上会导致查询变慢，因为旧版本数据仍然存在数据文件中，会导致查询扫描更多的数据块。
删除没有必要的clog
当事务达到一定上限必须通过冻结事务来避免事务回卷
更新FSM，VM和统计信息

FSM ：空闲空间映射，以.fsm进行存储。所有表和索引都有各自的FSM，每个FSM在相应的表或索引文件中存储有关每个页面的可用空间容量的信息。

PG多版本并发的一些优势：

事务回滚可立刻完成，无论事务执行了多少操作
数据可以进行很多更新，不必像oracle和innodb那样需要保证回滚段不会被用完

标签: PostgreSQL

返回列表

上一篇：PG的多版本并发控制(二)

下一篇：PG的锁(一)

相关文章

PG的pathman分区表工具

一、概述在PG<=10的版本中，都是通过表继承的方式进行分区的，必须使用CHECK CONSTRAINT将每个分区创建为子表。PostgreSQL 10提供了本机分区，它与经典方法没有什么不同...

PG体系结构(一)

PG体系结构(一)

一、进程结构PG数据库启动时会先启动一个主进程（9.3之前称为postmaster，9.3以后称为postgres server process），然后fork出一些辅助子进程（backend、bac...

pg_restore

逻辑备份恢复PG提供了pg_restore的命令可以为通过pg_dump转储的数据进行逻辑恢复。对于SQL脚本可通过psql进行恢复语法pg_restore [connection_option] [...

PG的锁(一)

一、表级锁1.1 表级锁模式常见锁模式以及应用场景：ACCESS SHARE ：select操作获取该模式锁资源，通常情况下所有只读取不修改表的查询都会获取该模式锁资源ROW SHARE ： sele...

PG的多版本并发控制(二)

PG的多版本并发控制(二)

二、 PG数据库DML操作的相关概念xmin、xmax、cmin、cmax是每个数据行tuple上的隐藏字段，主要用于区别不同事务以及相同事务内tuple的行版本。在了解这四个参数概念前，我们首先需要...

PG的锁(二)

四、死锁PostgreSQL自动检测死锁情况并会自动回滚其中一个事务进行处理，从而其他事务完成。db1=# select * from t1 where id in (1,2,3); id | i...

发表评论