PG的多版本并发控制(一)
一、 表系统字段几个比较重要概念
1.1 tuple
tuple表示表中的数据行,在MySQL中用row表示。
在表数据页中,主要分为普通的数据元祖和TOAST元祖。以下是一个普通数据元祖的结构,主要由三部分组成:HeapTupleHeaderData结构、NULL bitmap、user data。
t_xmin : 当一个事务插入一条新的数据行时,将该数据行的xmin标识为当前事务的事务ID
t_xmax : 新插入的数据行的xmax默认为0,当一个事务删除一条数据行时,将该数据行的xmax标识为当前事务的事务ID,相当于做了一个删除标记。
t_cid : 在同一事务内,当该命令操作导致会插入/删除操作时,使用t_cid进行计数
t_ctid : ctid标识了一个数据行tuple在表中的物理位置,ctid可以快速定位数据行,但是随着表数据的变更,在发生vacuum full之后,数据行对应的物理位置可能会发生改变。
1、数据库中查看tuple的ctid
## 查看当前数据行对应的ctid db1=# select ctid,* from t1; ctid | id -------+---- (0,1) | 1 (0,2) | 1 (0,3) | 1 (0,4) | 2 (0,5) | 2 (0,6) | 3 (0,7) | 3 (0,8) | 3 (8 rows)
2、数据库中查看tuple的xmin、xmax、ctid
db1=# select xmin,xmax,cmin,cmax,* from t2; xmin | xmax | cmin | cmax | id | name ---------+------+------+------+----+------ 1738613 | 0 | 0 | 0 | 1 | aa 1738614 | 0 | 0 | 0 | 2 | bb 1738615 | 0 | 0 | 0 | 3 | cc (3 rows)
1.2 事务id(txid)
当每个事务开始时,事务管理器都会分配一个唯一的标识符,也就是事务ID(txid), postgresql的txid是一个32位无符号整数,大约42亿。在数据库中可通过内置函数txid_current()查看当前事务ID号。
不会为BEGIN命令分配txid。在PG中,当BEGIN命令后,执行第一个命令时,事务管理器会分配tixd,然后启动其事务。
db1=# begin; BEGIN db1=# SELECT txid_current(); txid_current -------------- 1738649 (1 row)
postgres保留了以下三个特殊的事务ID号:
0 :无效事务ID。
1 :系统表初始化时事务ID
2 :冻结的事务ID
txid之间可以做比较,小于当前txid的事务为“past”,默认都是对当前事务可见的,大于当前txid的事务为称为“Future”,默认都是对当前事务不可见的。
pg的事务存在上限,随着事务ID的不断增长,达到最大值后再从头开始计数,就会出现以前的事务ID比当前的事务ID大的情况,按照上面的比较规则,就会认为最新产生的事务为“past”,这也是PG数据库中比较严重的事务回卷的问题。
为了解决事务回卷的问题,PG规定最新与最旧的两个事务之间的年龄差最大为231,如果事务之间的年龄差超过231时,就把旧的事务全部转换为事务ID号为2的冻结事务。当新事务与冻结事务做比较时,默认正常事务ID比冻结事务ID新。整体来讲可利用如下公式进行计算:((int32) (id1-id2)) < 0
如果该公式为真,则表示事务id1比事务id2旧。
当事务没有发生回卷时,上面公式相当于直接比大小即可。
当事务发生回卷时,例如id1=4294967295,id2=5,那么id1-id2=4294967290,将这个个差值转换为有符号的int32时,由于超过了2^31该数据会转换为一个负数,这样一来我们还是可以比较出id1比id2旧。