PG的analyze与vacuum

太阳2年前技术文章2482

analyze-统计信息

用于收集表的统计信息,只会对表加读锁,不影响表上其它SQL并发执行,对于大表只会读取表中部分数据

vacuum-碎片回收

标记旧版本行的信息为可用,以重复使用这部分空间 更新统计数据,保证执行计划的准确

在PG中,被删除或被更新废弃的数据不会在物理上从表中删除,除非被vacuum

vacuum分为两种:

a.简单的vacuum

简单的VACUUM(不带FULL)简单地收回空间并使其可以被重用,可以与select、DML并行执行,但vacuum期间不能用DDL修改表定义

这种形式中额外的空间并没有被还给操作系统(在大多数情况下),它仅仅被保留在同一个表中以备重用 b.vacuum full

需要获取排斥锁,不能与该表上的其它语句并行执行,需要额外的磁盘空间,因为它会创建该表的一个新拷贝,并且在操作完成之前都不会释放旧的拷贝

应尽量避免用vacuum full,vacuum full运行时间更长、可以回收更多的磁盘空间

VACUUM FULL将表的整个内容重写到一个新的磁盘文件中,并且不包含额外的空间,这使得没有被使用的空间被还给操作系统。

这种形式的命令更慢并且在其被处理时要求在每个表上保持一个排他锁

其它:

VACUUM会导致I/O流量的大幅度增加;

vacuum analyze: 这是两种命令的一种方便的组合形式,表示用简单的VACUUM标记旧版本行信息可复用,并更新统计数据;

在主库进行vacuum analyze,会传输至流复制的从和逻辑复制的从,执行后主从表的大小都会被收缩;

不过在从上不会记录vacuum执行的时间,想查询vacuum记录只能在主库查询。

        为确保PG库表统计信息的准确性,可在夜间为PG中库表配轮循的定时vacuum analyze任务,为减少对数据库的性能影响,每张表vacuum analyze后可sleep 10/30s,另控制每次vacuum analyze表的数量。

   


标签: PostgreSQL

相关文章

PG的统计信息(一)

一、统计信息1.1 PG统计信息概述pg的统计信息主要分为两种:第一类统计信息是是负载指标“统计信息”(Monitoring stats),通过stat collector进程进行实时采集更新的负载指...

PG常用命令

1、连库相关#连库 $ psql -h <hostname or ip> -p <端口> [数据库名称] [用户名称] #连库并执行命令 $ psql -h <ho...

PG的统计信息(三)

1.3 数据分布类统计信息1.3.1 pg_stats通过对pg_stats的查询,可以查看每个字段的数据分析统计信息,类似SQL Server的直方图,为优化器选择最佳执行计划提供依据,pg_sta...

PG的锁(一)

一、表级锁1.1 表级锁模式常见锁模式以及应用场景:ACCESS SHARE :select操作获取该模式锁资源,通常情况下所有只读取不修改表的查询都会获取该模式锁资源ROW SHARE : sele...

PG的多版本并发控制(一)

PG的多版本并发控制(一)

一、 表系统字段几个比较重要概念1.1  tupletuple表示表中的数据行,在MySQL中用row表示。在表数据页中,主要分为普通的数据元祖和TOAST元祖。以下是一个普通数据元祖的结构,主要由三...

REPMGR-PG高可用搭建(三)

REPMGR-PG高可用搭建(三)

2.2.2repmgr安装兼容性3节点均安装repmgr1.安装依赖 # yum install flex 2.下载解压 # wget -c https://repmgr.org/downloa...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。