等待事件latch: cache buffers chains 的分析与优化

荞麦2年前技术文章939

等待事件latch: cache buffers chains 的分析与优化

要理解latch: cache buffers chains并解决这个问题,就需要深入的了解Buffer Cache及其原理。

1Buffer Cache概述

Buffer CacheSGA的一部分,Oracle利用Buffer Cache来管理data blockBuffer Cache的最终目的就是尽可能的减少磁盘I/O

内存中数据块的存放位置是记录在一个hash列表当中的。 当一个会话需要访问某个数据块时它首先要搜索这个hash 列表从列表中获得数据块的地址然后通过这个地址去访问需要的数据块这个列表 Oracle 会使用一个latch来保护它的完整性。 当一个会话需要访问这个列表时需要获取一个Latch只有这样才能保证这个列表在这个会话的浏览当中不会发生变化。

2如何定位数据块是否在buffer cache

首先,通过对数据块所在的文件号和块号进行hash计算,算出对应bucket号(hash bucket)。

 


沿着对应hash bucket所在hash chain list访问链上的buffer headerbh,相关信息由x$bh视图描述),hash chain list上挂载了一或多个bhbhData block一一对应。

 





 

 

3latch:cache buffers chains出现的原因

3.1  不够优化的SQL

大量逻辑读的SQL语句就有可能产生非常严重的latch:cache buffers chains等待,因为每次要访问一个block,就需要获得该latch,由于有大量的逻辑读,那么就增加了latch:cache buffers chains争用的机率。   对于正在运行的SQL语句,产生非常严重的latch:cache buffers chains争用,可以利用下面SQL查看执行计划,并设法优化SQL语句。

select * from table(dbms_xplan.display_cursor(sql_id,plan_hash_value));

如果SQL已经运行完毕,我们就看AWR报表里面的SQL Statistics->SQL ordered by Gets->Gets per Exec,试图优化这些SQL

示例读库拉报表卡慢

分析SQL的执行计划发现使用了MERGE JOIN CARTESIAN(笛卡尔积)执行计划如下

 

SQL单次执行时间超过1小时修改参数关闭笛卡尔积然后SQL产生了新的执行计划优化后执行时间不足1该等待事件大部分可通过优化SQL解决

3.2 热点块争用

1)查找数据库是否存在latch的争用
select sid,event,p1,p1raw from v$session_wait where event='latch: cache buffers chains';

2)下面查询查出Top 5 的争用的latch address
select * from( select CHILD#,ADDR,GETS ,MISSES,SLEEPS from v$latch_children where name = 'cache buffers chains' and misses>0 and sleeps>0 order by 5 desc, 1, 2, 3) where rownum<=5

 

3)然后利用下面查询找出Hot block    

SELECT  

  /*+ RULE */  

  E.OWNER  

  || '.'  

  || E.SEGMENT_NAME SEGMENT_NAME,  

  E.PARTITION_NAME,  

  E.EXTENT_ID EXTENT#,  

  X.DBABLK - E.BLOCK_ID + 1 BLOCK#,  

  X.TCH,  

  L.CHILD#  

FROM SYS.V$LATCH_CHILDREN L,  

  SYS.X$BH X,  

  SYS.DBA_EXTENTS E  

WHERE X.HLADDR='00000001F8C387C0'  

AND E.FILE_ID = X.FILE#  

AND X.HLADDR  = L.ADDR  

AND X.DBABLK BETWEEN E.BLOCK_ID AND E.BLOCK_ID + E.BLOCKS - 1  

ORDER BY X.TCH DESC;

3.3 改嵌套循环为hash join

分析引起该等待事件的SQL的执行计划发现使用了嵌套循环执行计划如下

 

可以通过hint使用/*+use_hash(t1 t2)*/指定关联方式hash join主要适用于两表差距很大,小表可以完全放入内存情况

3.4 Hash Bucket太少

需要更改_db_block_hash_buckets隐含参数。其实在Oracle9i之后,我们基本上不会遇到这个问题了,除非遇到Bug。所以这个是不推荐的,记住,在对Oracle的隐含参数做修改之前一定要咨询Oracle Support 

3.5 Latch太少

需要更改_db_block_lru_latches隐含参数10G之后该参数默认为cpu_count8说明该参数依赖CPU配置不建议自行修改


相关文章

ES运维(一)底层数据存储原理

ES运维(一)底层数据存储原理

1、ES底层数据存储原理架构图Segment工作流程:A、 新的文档在内存中组织B、 每隔一段时间,buffer将会被提交:生成一个新的segment(一个额外的新的倒序索引)并被写到磁盘,同时一个新...

数仓主流架构简介之二

数仓主流架构简介之二

一、流批一体数据批流一体是一种云计算架构模式,它结合了批处理和流处理的特点,以实现更高效、灵活和可扩展的数据处理能力。在这种模式下,数据可以同时进行批处理和流处理,以满足不同场景下的需求流批一体:是指...

Kerberos集成Hadoop

Kerberos集成Hadoop

1、创建kerberos主体(1)路径准备为各服务准备一个安全的路径来存储keytab文件mkdir /etc/security/keytab/ chown -R ro...

python-日志分析

1、概述生产中会生成大量的系统日志、应用程序日志、安全日志等等日志,通过对日志的分析可以了解服务器的负载、健康状况,可以分析客户的分布情况、客户的行为,甚至基于这些分析可以做出预测。一般采集流程:日志...

Docker Engine - Containerd

Docker Engine - Containerd

1、背景Docker 崛起很久以前,Docker 强势崛起,以 “镜像” 这个大招席卷全球,对其他技术进行致命的降维打击,使其毫无招架之力,就连 Google 也不例外。Google 为了不被拍死在沙...

K8s Pod无法访问SLB地址

K8s Pod无法访问SLB地址

一、问题现象客户反馈172.16.11.220 telnet 47.99.87.129 80 不通,另一台172.16.11.219可以通。二、排查思路172.16.11.220,172.16.11....

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。