等待事件latch: cache buffers chains 的分析与优化

荞麦3年前技术文章1160

等待事件latch: cache buffers chains 的分析与优化

要理解latch: cache buffers chains并解决这个问题,就需要深入的了解Buffer Cache及其原理。

1Buffer Cache概述

Buffer CacheSGA的一部分,Oracle利用Buffer Cache来管理data blockBuffer Cache的最终目的就是尽可能的减少磁盘I/O

内存中数据块的存放位置是记录在一个hash列表当中的。 当一个会话需要访问某个数据块时它首先要搜索这个hash 列表从列表中获得数据块的地址然后通过这个地址去访问需要的数据块这个列表 Oracle 会使用一个latch来保护它的完整性。 当一个会话需要访问这个列表时需要获取一个Latch只有这样才能保证这个列表在这个会话的浏览当中不会发生变化。

2如何定位数据块是否在buffer cache

首先,通过对数据块所在的文件号和块号进行hash计算,算出对应bucket号(hash bucket)。

 


沿着对应hash bucket所在hash chain list访问链上的buffer headerbh,相关信息由x$bh视图描述),hash chain list上挂载了一或多个bhbhData block一一对应。

 





 

 

3latch:cache buffers chains出现的原因

3.1  不够优化的SQL

大量逻辑读的SQL语句就有可能产生非常严重的latch:cache buffers chains等待,因为每次要访问一个block,就需要获得该latch,由于有大量的逻辑读,那么就增加了latch:cache buffers chains争用的机率。   对于正在运行的SQL语句,产生非常严重的latch:cache buffers chains争用,可以利用下面SQL查看执行计划,并设法优化SQL语句。

select * from table(dbms_xplan.display_cursor(sql_id,plan_hash_value));

如果SQL已经运行完毕,我们就看AWR报表里面的SQL Statistics->SQL ordered by Gets->Gets per Exec,试图优化这些SQL

示例读库拉报表卡慢

分析SQL的执行计划发现使用了MERGE JOIN CARTESIAN(笛卡尔积)执行计划如下

 

SQL单次执行时间超过1小时修改参数关闭笛卡尔积然后SQL产生了新的执行计划优化后执行时间不足1该等待事件大部分可通过优化SQL解决

3.2 热点块争用

1)查找数据库是否存在latch的争用
select sid,event,p1,p1raw from v$session_wait where event='latch: cache buffers chains';

2)下面查询查出Top 5 的争用的latch address
select * from( select CHILD#,ADDR,GETS ,MISSES,SLEEPS from v$latch_children where name = 'cache buffers chains' and misses>0 and sleeps>0 order by 5 desc, 1, 2, 3) where rownum<=5

 

3)然后利用下面查询找出Hot block    

SELECT  

  /*+ RULE */  

  E.OWNER  

  || '.'  

  || E.SEGMENT_NAME SEGMENT_NAME,  

  E.PARTITION_NAME,  

  E.EXTENT_ID EXTENT#,  

  X.DBABLK - E.BLOCK_ID + 1 BLOCK#,  

  X.TCH,  

  L.CHILD#  

FROM SYS.V$LATCH_CHILDREN L,  

  SYS.X$BH X,  

  SYS.DBA_EXTENTS E  

WHERE X.HLADDR='00000001F8C387C0'  

AND E.FILE_ID = X.FILE#  

AND X.HLADDR  = L.ADDR  

AND X.DBABLK BETWEEN E.BLOCK_ID AND E.BLOCK_ID + E.BLOCKS - 1  

ORDER BY X.TCH DESC;

3.3 改嵌套循环为hash join

分析引起该等待事件的SQL的执行计划发现使用了嵌套循环执行计划如下

 

可以通过hint使用/*+use_hash(t1 t2)*/指定关联方式hash join主要适用于两表差距很大,小表可以完全放入内存情况

3.4 Hash Bucket太少

需要更改_db_block_hash_buckets隐含参数。其实在Oracle9i之后,我们基本上不会遇到这个问题了,除非遇到Bug。所以这个是不推荐的,记住,在对Oracle的隐含参数做修改之前一定要咨询Oracle Support 

3.5 Latch太少

需要更改_db_block_lru_latches隐含参数10G之后该参数默认为cpu_count8说明该参数依赖CPU配置不建议自行修改


相关文章

ntp服务配置

ntp服务配置

安装:yum -y install ntp服务命令systemctl enable ntpd 开机启动systemctl start ntpd 启动服务systemctl stop ntpd 停止服务...

mcasttest-tool组播检测工具

mcasttest-tool组播检测工具

检测组播mcasttest-tool是oracle组播检测工具,组播是oracle 11.2.0.2开始的新功能1、上传mcasttest工具解压并授权[root@rac1 soft]# cd /u0...

Apache hive 对接达梦数据库

Apache hive 对接达梦数据库

1、背景由于国产化需求,客户需要使用dm数据库作为hive的元数据库。需要进行对应适配2、配置本次使用的环境hive 3.1.3 hadoop 3.2.4 ranger 2.3.0 Spark ...

hive 报 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

hive 报 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

解决办法:关键需要配置两个配置:mapred-site.xml 和 yarn-site.xml下面配置hadoop classpath。先运行shell命令:hadoop classpath添加一个配...

centos6下时间修改

1、手动修改1)使用date命令修改的时间是系统时间临时生效的,重启系统后失效,需要将当前时间和硬件时间同步后才可以持久生效。date -s "2012-05-23 01:01:01&quo...

PG体系结构(一)

PG体系结构(一)

一、进程结构PG数据库启动时会先启动一个主进程(9.3之前称为postmaster,9.3以后称为postgres server process),然后fork出一些辅助子进程(backend、bac...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。