PG的analyze与vacuum
analyze-统计信息
用于收集表的统计信息,只会对表加读锁,不影响表上其它SQL并发执行,对于大表只会读取表中部分数据
vacuum-碎片回收
标记旧版本行的信息为可用,以重复使用这部分空间 更新统计数据,保证执行计划的准确
在PG中,被删除或被更新废弃的数据不会在物理上从表中删除,除非被vacuum
vacuum分为两种:
a.简单的vacuum
简单的VACUUM(不带FULL)简单地收回空间并使其可以被重用,可以与select、DML并行执行,但vacuum期间不能用DDL修改表定义
这种形式中额外的空间并没有被还给操作系统(在大多数情况下),它仅仅被保留在同一个表中以备重用 b.vacuum full
需要获取排斥锁,不能与该表上的其它语句并行执行,需要额外的磁盘空间,因为它会创建该表的一个新拷贝,并且在操作完成之前都不会释放旧的拷贝
应尽量避免用vacuum full,vacuum full运行时间更长、可以回收更多的磁盘空间
VACUUM FULL将表的整个内容重写到一个新的磁盘文件中,并且不包含额外的空间,这使得没有被使用的空间被还给操作系统。
这种形式的命令更慢并且在其被处理时要求在每个表上保持一个排他锁
其它:
VACUUM会导致I/O流量的大幅度增加;
vacuum analyze: 这是两种命令的一种方便的组合形式,表示用简单的VACUUM标记旧版本行信息可复用,并更新统计数据;
在主库进行vacuum analyze,会传输至流复制的从和逻辑复制的从,执行后主从表的大小都会被收缩;
不过在从上不会记录vacuum执行的时间,想查询vacuum记录只能在主库查询。
为确保PG库表统计信息的准确性,可在夜间为PG中库表配轮循的定时vacuum analyze任务,为减少对数据库的性能影响,每张表vacuum analyze后可sleep 10/30s,另控制每次vacuum analyze表的数量。