等待事件latch: cache buffers chains 的分析与优化

荞麦2年前技术文章744

等待事件latch: cache buffers chains 的分析与优化

要理解latch: cache buffers chains并解决这个问题,就需要深入的了解Buffer Cache及其原理。

1Buffer Cache概述

Buffer CacheSGA的一部分,Oracle利用Buffer Cache来管理data blockBuffer Cache的最终目的就是尽可能的减少磁盘I/O

内存中数据块的存放位置是记录在一个hash列表当中的。 当一个会话需要访问某个数据块时它首先要搜索这个hash 列表从列表中获得数据块的地址然后通过这个地址去访问需要的数据块这个列表 Oracle 会使用一个latch来保护它的完整性。 当一个会话需要访问这个列表时需要获取一个Latch只有这样才能保证这个列表在这个会话的浏览当中不会发生变化。

2如何定位数据块是否在buffer cache

首先,通过对数据块所在的文件号和块号进行hash计算,算出对应bucket号(hash bucket)。

 


沿着对应hash bucket所在hash chain list访问链上的buffer headerbh,相关信息由x$bh视图描述),hash chain list上挂载了一或多个bhbhData block一一对应。

 





 

 

3latch:cache buffers chains出现的原因

3.1  不够优化的SQL

大量逻辑读的SQL语句就有可能产生非常严重的latch:cache buffers chains等待,因为每次要访问一个block,就需要获得该latch,由于有大量的逻辑读,那么就增加了latch:cache buffers chains争用的机率。   对于正在运行的SQL语句,产生非常严重的latch:cache buffers chains争用,可以利用下面SQL查看执行计划,并设法优化SQL语句。

select * from table(dbms_xplan.display_cursor(sql_id,plan_hash_value));

如果SQL已经运行完毕,我们就看AWR报表里面的SQL Statistics->SQL ordered by Gets->Gets per Exec,试图优化这些SQL

示例读库拉报表卡慢

分析SQL的执行计划发现使用了MERGE JOIN CARTESIAN(笛卡尔积)执行计划如下

 

SQL单次执行时间超过1小时修改参数关闭笛卡尔积然后SQL产生了新的执行计划优化后执行时间不足1该等待事件大部分可通过优化SQL解决

3.2 热点块争用

1)查找数据库是否存在latch的争用
select sid,event,p1,p1raw from v$session_wait where event='latch: cache buffers chains';

2)下面查询查出Top 5 的争用的latch address
select * from( select CHILD#,ADDR,GETS ,MISSES,SLEEPS from v$latch_children where name = 'cache buffers chains' and misses>0 and sleeps>0 order by 5 desc, 1, 2, 3) where rownum<=5

 

3)然后利用下面查询找出Hot block    

SELECT  

  /*+ RULE */  

  E.OWNER  

  || '.'  

  || E.SEGMENT_NAME SEGMENT_NAME,  

  E.PARTITION_NAME,  

  E.EXTENT_ID EXTENT#,  

  X.DBABLK - E.BLOCK_ID + 1 BLOCK#,  

  X.TCH,  

  L.CHILD#  

FROM SYS.V$LATCH_CHILDREN L,  

  SYS.X$BH X,  

  SYS.DBA_EXTENTS E  

WHERE X.HLADDR='00000001F8C387C0'  

AND E.FILE_ID = X.FILE#  

AND X.HLADDR  = L.ADDR  

AND X.DBABLK BETWEEN E.BLOCK_ID AND E.BLOCK_ID + E.BLOCKS - 1  

ORDER BY X.TCH DESC;

3.3 改嵌套循环为hash join

分析引起该等待事件的SQL的执行计划发现使用了嵌套循环执行计划如下

 

可以通过hint使用/*+use_hash(t1 t2)*/指定关联方式hash join主要适用于两表差距很大,小表可以完全放入内存情况

3.4 Hash Bucket太少

需要更改_db_block_hash_buckets隐含参数。其实在Oracle9i之后,我们基本上不会遇到这个问题了,除非遇到Bug。所以这个是不推荐的,记住,在对Oracle的隐含参数做修改之前一定要咨询Oracle Support 

3.5 Latch太少

需要更改_db_block_lru_latches隐含参数10G之后该参数默认为cpu_count8说明该参数依赖CPU配置不建议自行修改


相关文章

MySQL运维实战(5.1) 字符和编码的基本概念

MySQL运维实战(5.1) 字符和编码的基本概念

字符和编码字符字符是符号,是人们用于交流的各类符号,如26个英文字母、汉字、标点符号、数学运算符、其他语言的字母和符号。编码编码是计算机中以二进制方式存储字符的方式。字符集字符集是字符和编码的映射表。...

CDH实操--客户端安装

CDH实操--客户端安装

概述安装CDH客户端,主要是方便在CDH部署节点以外,通过客户端的方式连接CDH上的hdfs,hive和hbase服务1、安装jdk(适配CDH即可,一般1.8)2、获取安装包3、部署安装包把安装包解...

bind服务-1

bind服务-1

DNS:域名系统(英文:Domain Name System)是一个域名系统,是万维网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP...

Redis 哨兵机制

Redis 哨兵机制

前言Redis 主从复制模式下,一旦主节点出现了故障不可达,需要人工干预进行故障转移,无论对于 Redis 的应用方还是运维方都带来了很大的不便。对于应用方来说无法及时感知到主节点的变化,必然会造成一...

HDFS核心参数

HDFS核心参数

1.NameNode内存生产配置(1)NameNode内存计算,每个文件块大概占用150byte,一台服务器128G内存为例,能存储9.1亿个文件128 * 1024 * 1024 * 1024  /...

Linux_ACL权限、mask值

acl权限在什么情况下使用:当要给一个用户与文件的属主、属组、其他人权限都不同的时候使用。也就是说,这个用户对应于这个文件不属于三个身份中的任何一种,是属于第四种身份,那么我们就需要使用acl权限去给...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。