MySQL优化器特性(九)行数评估

俊达2年前技术文章1642

查询的行数在成本计算中起了很重要的作用:

1、row_evaluate_cost和行数直接相关

2、需要访问多少索引页面,和行数直接相关。根据页面大小和平均索引条目长度计算每个索引页面的记录数,根据记录数计算索引页面数。

3、需要回表访问多少表的页面,和行数直接相关。mysql认为range访问时,每一行记录都需要访问一个数据页面。

4、主键范围扫描页面数,和行数直接相关。


那么如何精确的评估查询需要访问的记录数呢?

InnoDB中有一个index dive的特性,可以根据range区间范围,直接到索引中统计满足条件的记录数。


index dive

index dive统计一个索引区间范围内记录数的逻辑大致如下(btr_estimate_n_rows_in_range):

1、找到范围的下界

2、扫描数据,直到范围的上界,或者扫描的页面数超出限制(10个页面?)

3、如果范围内的页面数不多,则可以精确统计出需要访问的记录数。

4、如果范围内的页面数超过扫描限制,则根据已经扫描的页面,计算平均每页记录数,乘以页面数量,得到一个预估的纪录数。







页面的数量可以通过统计上一层branch页面中的索引条目数得到。根据索引结构的特征,索引页面中的一行记录指向下一个层级中的一个page,根据索引页面中的记录数,就可以得到下一个层级中相应的页面数:


如果一个SQL中涉及到的range的数量特别多(比如in列表中传入了大量数据),则统计每一range的记录数就会消耗大量成本,mysql有一个参数eq_range_index_dive_limit,用于限制优化器进行index dive的开销。如果一个SQL中的range数超过了eq_range_index_dive_limit,优化器就不会通过index dive来评估记录数,转而使用表和索引的统计信息,或者使用经验公式来评估记录数。

mysql 8.0中,eq_range_index_dive_limit默认值为200。



相关文章

MySQL运维实战(4.7) SQL_MODE之ANSI_QUOTES

默认情况下,mysql使用反引号(`)作为标识符的引号。使用mysql关键字作为表名、字段名会报语法错误,这时可以加上反引号( `),避免报错。设置ANSI_QUOTES后,使用双引号(")...

MySQL运维实战(4.6) SQL_MODE之NO_BACKSLASH_ESCAPES

设置NO_BACKSLASH_ESCAPES后,反斜杠(\)不作为转义符。不设置NO_BACKSLASH_ESCAPES时,反斜杠(\)用来转义后一个字符mysql> create&n...

MySQL运维实战(5.1) 字符和编码的基本概念

MySQL运维实战(5.1) 字符和编码的基本概念

字符和编码字符字符是符号,是人们用于交流的各类符号,如26个英文字母、汉字、标点符号、数学运算符、其他语言的字母和符号。编码编码是计算机中以二进制方式存储字符的方式。字符集字符集是字符和编码的映射表。...

MySQL运维实战(5.5) 数据导入导出时的字符集问题

mysql可以使用load data/select into outfile或mysqldump工具进行数据导入导出。下面分别分析数据导入导出时的字符集相关问题。准备测试数据创建测试表,2个字段分别使...

 MySQL运维实战(1.3)安装部署:源码编译安装

MySQL运维实战(1.3)安装部署:源码编译安装

源码编译安装通常不需要自己编译mysql源码,编译的mysql和二进制包的内容基本一致。当然有些时候可能会需要采用源码编译的方式安装,安装一些非标准版本的mysql安装一些社区的patch、bugfi...

MySQL运维实战之备份和恢复(8.1)xtrabackup全量备份

xtrabackup是percona开源的mysql物理备份工具。xtrabackup 8.0支持mysql 8.0版本的备份和恢复。xtrabackup 2.4支持mysql 5.7及以下版本的备份...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。