MySQL运维之分库分表与读写分离
分库分表
1.介绍
问题分析
随着互联网以及移动互联网的发展,应用系统的数据量也是成指数式增长,若采用单数据库进行数据存储,存在以下性能瓶颈:
IO瓶颈:热点数据太多,数据库缓存不足,产生大量磁盘IO,效率较低。请求数据太多,带宽不够,网络IO瓶颈。
CPU瓶颈:排序、分组、连接查询、聚合统计等SQL会耗费大量的CPU资源,请求数太多,CPU出现瓶颈。
分库分表的中心思想就是将数据分散存储,使得单一数据库/表的数据量变小来缓解的单一数据库的性能问题,从而达到提升数据库性能的目的。
拆分策略
垂直拆分
垂直分库:以表为依据,根据业务将不同表拆分到不同库中。
特点:
1.每个库的表结构都不一样。
2.每个库的数据也不一样。
3.所有库的并集是全量数据。
垂直分表:以字段为依据,根据字段属性将不同字段拆分到不同表中。
特点:
1.每个表的结构都不一样。
2.每个表的数据也不一样,一般通过一列(主键/外键)关联。
3.所有表的并集是全量数据。
水平拆分
水平分库:以字段为依据,按照一定策略,将一个库的数据拆分到多个库中。
特点:
1.每个库的表结构都一样。
2.每个库的数据都不一样。
3.所有库的并集是全量数据。
水平分表:以字段为依据,按照一定策略,将一个表的数据拆分到多个表中。
特点:
1.每个表的结构都一样。
2.每个表的数据都不一样。
3.所有表的并集是全量数据。
⚪ shardingJDBC:基于AOP原理,在应用程序中对本地执行的SQL进行拦截,解析、改写、路由处理。需要自行编码配置实现,只支持Java语言,性能较高。
⚪ MyCat:数据库分库分表的中间件,不用调整代码即可实现分库分表,支持多种语言,性能不及前者。
2.Mycat概述
Mycat是开源的、活跃的、基于Java语言编写的MySQL数据库中间件。可以像使用mysql一样来使用mycat,对于开发人员来说根本感觉不到mycat的存在。
优势:
⚪ 性能可靠稳定
⚪ 强大的技术团队
⚪ 体系完善
⚪ 社区活跃
下载
下载地址:http://dl.mycat.org.cn/
安装
Mycat是采用Java语言开发的开源的数据库中间件,支持Windows和Linux运行环境,需要提前在准备好的服务器中安装如下软件:
⚪ MySQL
⚪ JDK
⚪ Mycat
Mycat安装
利用工具上传Mycat压缩包到服务器
Mycat-server-1.6.7.3-release-20210913163959-linux.tar.gz
2.解压Mycat的压缩包
tar -zxvf Mycat-server-1.6.7.3-release-20210913163959-linux.tar.gz -C /usr/local/
目录结构
bin:存放可执行文件,用于启动停止mycat
conf:存放mycat的配置文件
lib:存放mycat的项目依赖包(jar)
logs:存放mycat的日志文件
概念介绍
3.Mycat入门
需求
由于tb_order表中的数据量很大,磁盘IO及容量都达到了瓶颈,现在需要对tb_order表进行数据分片,分为三个数据节点,每一个节点主机位于不同的服务器上,具体的结构,如图:
环境准备
分片配置(schema.xml)
分片配置(server.xml)
配置mycat的用户及用户的权限信息:
启动服务
切换到MyCat的安装目录,执行如下的指令,启动Mycat:
启动
bin/mycat start
停止
bin/mycat stop
Mycat启动之后,占用端口号8066。
启动完毕之后,可以查看logs目录下的启动日志,查看Mycat是否启动完成。
tail -f logs/wrapper.log
分片测试
通过如下指令,连接并登录Mycat
mysql -h -P 8066 -uroot -p
4.Mycat配置
schema.xml
schema.xml作为Mycat中最重要的配置文件之一,涵盖了MyCat的逻辑库、逻辑表、分片规则、分片节点及数据源的配置。
主要包含以下三组标签:
⚪ schema标签
schema标签用于定义MyCat实例中的逻辑库,一个MyCat实例中,可以有多个逻辑库,可以通过schema标签来划分不同的逻辑库。MyCat中的逻辑库的概念,等同于MySQL中的database概念,需要操作某个逻辑库下的表时,也需要切换逻辑库(use xxx)。
核心属性:
● name:指定自定义的逻辑库库名
● checkSQLschema:在SQL语句操作时指定了数据库名称,执行时是否自动去除;true:自动去除,false:不自动去除
● sqlMaxLimit:如果未指定limit进行查询,列表查询模式查询多少条记录
table标签定义了MyCat中逻辑库schema下的逻辑表,所有需要拆分的表都需要在table标签中定义。
核心属性:
● name:定义逻辑表名,在该逻辑库下唯一
● dataNode:定义逻辑表所属的dataNode,该属性需要与dataNode标签中name对应;多个dataNode逗号分割
● rule:分片规则的名字,分片规则名字是在rule.xml中定义的
● primaryKey:逻辑表对应真实表的主键
● type:逻辑表的类型,目前逻辑表只有全局表和普通表,如果未配置,就是普通表;全局表,配置为global
⚪ datanode标签
dataNode标签中定义了MyCat中的数据节点,也就是数据分片。一个dataNode标签就是一个独立的数据分片。
核心属性:
● name:定义数据节点名称
● dataHost:数据库实例主机名称,引用自dataHost标签中name属性
● database:定义分片所属数据库
⚪ datahost标签
该标签在MyCat逻辑库中作为底层标签存在,直接定义了具体的数据库实例、读写分离、心跳语句。
核心属性:
● name:唯一标识,供上层标签使用
● maxCon/minCon:最大连接数/最小连接数
● balance:负载均衡策略,取值0,1,2,3
● writeType:写操作分发方式(0:写操作转发到第一个writeHost,第一个挂了,切换到第二个;1:写操作随机分发到配置的writeHost)
● dbDriver:数据库驱动,支持native、jdbc
rule.xml
rule.xml中定义所有拆分表的规则,在使用过程中可以灵活的使用分片算法,或者对同一个分片算法使用不同的参数,它让分片过程可配置化。主要包含两类标签:tableRule、Function。
server.xml
server.xml配置文件包含了MyCat的系统配置信息,主要有两个标签:system、user。
⚪ system标签
⚪ user标签
5.Mycat分片
垂直拆分
⚪ 场景
在业务系统中,涉及以下表结构,但是由于用户与订单每天都会产生大量的数据,单台服务器的数据存储及处理能力是有限的,可以对数据库进行拆分,原有的数据库表如下。
⚪ 准备
分别在三台MySQL中创建数据库shopping。
⚪ 配置
⚪ 全局表配置
对于省、市、区/县表,是属于数据字典表,在多个业务模块中都可能会遇到,可以将其设为全局表,利于业务操作。
水平拆分
⚪ 场景
在业务系统中,有一张表(日志表),业务系统每天都会产生大量的日志数据,单台服务器的数据存储及处理能力是有限的,可以对数据库表进行拆分。
⚪ 准备
分别在三台MySQL中创建数据库。
⚪ 配置
⚪ 分片规则-范围
根据指定的字段及其配置的范围与数据节点的对应情况,来决定该数据属于哪一个分片。
⚪ 分片规则-取模
根据指定的字段值与节点数量进行求模运算,根据运算结果,来决定该数据属于哪一个分片。
⚪ 分片规则-一致性hash
一致性hash,相同的哈希因子计算值总是被划分到相同的分区表中,不会因为分区节点的增加改变原来数据的分区位置。
⚪ 分片规则-枚举
通过在配置文件中配置可能的枚举值,指定数据分布到不同数据节点上,本规则适用于按照省份、性别、状态拆分数据等业务。
⚪ 分片规则-应用指定
运行阶段由应用自主决定路由到哪个分片,直接根据字符子串(必须是数字)计算分片号。
⚪ 分片规则-固定分片hash算法
该算法类似于十进制的取模运算,但是为二进制的操作,例如,取id的二进制低10位与1111111111进行位&运算。
⚪ 分片规则-字符串hash解析
截取字符串中的指定位置的子字符串,进行hash算法,算出分片。
⚪ 分片规则-按(天)日期分片
⚪ 分片规则-自然月
使用场景为按照月份来分片,每个自然月为一个分片。
6.Mycat管理及监控
Mycat原理
Mycat管理
Mycat默认开通2个端口,可以在server.xml中进行修改。
⚪ 8066数据访问端口,进行DML和DDL操作。
⚪ 9066数据库管理端口,mycat服务管理控制功能,用于管理mycat的整个集群状态
mysql -h 192.168.200.210 -p 9066 -uroot -proot
Mycat-eye
⚪ 介绍
Mycat-web(Mycat-eye)是对mycat-server提供监控服务,功能不局限于对mycat-server使用。他通过JDBC连接对Mycat、Mysql监控,监控远程服务器(仅限于Linux系统)的cpu、内存、网络、磁盘。
Mycat-eye运行过程中需要依赖zookeeper,因此需要先安装zookeeper。
⚪ 安装
Zookeeper安装
上传安装包
zookeeper-3.4.6.tar.gz
2.解压
tar -zxcf zookeeper-3.4.6.tar.gz -C /usr/local/
3.创建数据存放目录
cd /usr/local/zookeeper-3.4.6/
mkdir data
4.修改配置文件名称并配置
cd config
mv zoo_sample.cfg zoo.cfg
5.配置数据存放目录
dataDir=/usr/local/zookeeper-3.4.6/data
6.启动zookeeper
bin/zkServer.sh start
bin/zkServer.sh status
Mycat-web安装
1.上传安装包
Mycat-web.tar.gz
2.解压
tar -zxvf Mycat-web.tar.gz -C /usr/local/
3.目录介绍
etc —> jetty 配置文件
lib —> 依赖jar包
mycat-web —>mycat-web项目
readme.txt
start.jar —>启动jar
start.sh —>linux启动脚本
4.启动
sh start.sh
5.访问
http://192.168.200.210:8082/mycat
7.总结
1.分库分表介绍
核心:将单台数据库服务器的数据分散(垂直拆分、水平拆分)存储在多台数据库中
2.Mycat概述
MyCat是一个开源分库分表的中间件
3.Mycat入门
入门程序
4.Mycat配置
Schema.xml、rule.xml、sever.xml
5.Mycat分片
分片规则:范围、取模、枚举、一致性hash、固定分片hash算法、字符串hash解析算法
、按天分片、按自然月分片
6.Mycat管理及监控
原理、管理、监控工具
四、读写分离
1.介绍
读写分离,就是把数据库的读和写的操作分开,以对应不同的数据库服务器。主数据库提供写操作,从数据库提供读操作,这样能有效地减轻单台数据库的压力。
通过MyCat即可轻易实现上述功能,不仅可以支持MySQL,也可以支持Oracle和SQL Server。
2.一主一从
原理
MySQL的主从复制,是基于二进制日志(binlog)实现的。
环境准备
3.一主一从读写分离
配置
Mycat控制后台数据库的读写分离和负载均衡由schema.xml文件datahost标签的balance属性控制。
问题:主节点Master宕机之后,业务系统就只能够读,而不能写入数据了。
4.双主双从
介绍
一个主机Master1用于处理所有写请求,它的主机Slave1和另一台主机Master2还有它的从机Slave2负责所有读请求。当Master1主机宕机后,Master2主机负责写请求,Master1、Master2互为备机。架构如下:
准备工作
需要5台服务器,具体的服务器及软件安装如下:
关闭以上所有的防火墙:
systemctl stop firewalld
systemctl disable firewalld
搭建
⚪ 主库配置(Master1-192.168.200.211)
修改配置文件/etc/my.cnf
# mysql服务ID,保证整个集群环境中唯一,取值范围:1-2^32-1,默认为1 server-id=1 # 指定同步的数据库 binlog-do-db=db01 binlog-do-db=db02 binlog-do-db=db03 # 在作为从数据库的时候,有写入操作也要更新二进制日志文件 log-slave-updates
2.重启MySQL服务器
systemctl restart mysqld
⚪ 主库配置(Master1-192.168.200.213)
# mysql服务ID,保证整个集群环境中唯一,取值范围:1-2^32-1,默认为1 server-id=3 # 指定同步的数据库 binlog-do-db=db01 binlog-do-db=db02 binlog-do-db=db03 # 在作为从数据库的时候,有写入操作也要更新二进制日志文件 log-slave-updates
2.重启MySQL服务器
systemctl restart mysqld
⚪ 两台主库创建账号并授权
# 创建itcast用户,并设置密码,该用户可以在任意主机连接该MySQL服务 CREATE USER 'itcast'@'%' IDENTIFIED WITH mysql_native_password BY 'Root@123456'; # 为'itcast'@'%'用户分配主从复制权限 GRANT REPLICATION SLAVE ON *.* TO 'itcast'@'%';
通过指令,查看两台主库的二进制日志坐标
show master status;
⚪ 从库配置(Slave1-192.168.200.212)
1.修改配置文件/etc/my.cnf
# mysql服务ID,保证整个集群环境中唯一,取值范围:1-2^32-1,默认为1 server-id=2
2.重启MySQL服务器
systemctl restart mysqld
⚪ 两台从库配置关联的主库
CHANGE MASTER TO MASTER_HOST='xxx.xxx.xxx.xxx',MASTER_USER='xxx',MASTER_PASSWORD='xxx', MASTER_LOG_FILE='xxx',MASTER_LOG_POS_xxx;
需要注意slvae1对应的是master1,slave2对应的是master2.
启动两台从库主从复制,查看从库状态
start slave;
show slave status \G;
⚪ 两台主库相互复制
Master2复制Master1,Master1复制Master2。
CHANGE MASTER TO MASTER_HOST='xxx.xxx.xxx.xxx',MASTER_USER='xxx',MASTER_PASSWORD='xxx', MASTER_LOG_FILE='xxx',MASTER_LOG_POS_xxx;
启动两台从库主从复制,查看从库状态
start slave;
show slave status \G;
5.双主双从读写分离
配置
Mycat控制后台数据库的读写分离和负载均衡由schema.xml文件和datahost标签的balance属性控制,通过writeType及switchType未完成失败自动切换的。
balance=“1”
代表全部的readHost与stand by writeHost参与select语句的负载均衡,简单的说,当双主双从模式(M1->S1,M2->S2,并且M1与M2互为主备),正常情况下,M2,S1,S2都参与select语句的负载均衡;
writeType
0:写操作都转发到第一台writeHost,writeHost1
1:所有的写操作都随机地发送到配置的writeHost上;
switchType
-1:不自动切换
1:自动切换
6.总结
1.介绍
读写分离是为了降低单台服务器的访问压力,写走主库,读走从库。
2.一主一从
MySQL主从复制是基于二进制日志binlog实现的。master、slave
3.一主一从读写分离
< writeHost > < readHost />< /writeHost >、balance属性
4.双主双从
两台主库,相互复制,互为主备,增强MySQL的可用性。
5.双主双从读写分离
< writeHost > < readHost />< /writeHost >、balance、writeType、switchType属性
————————————————
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/qq_40492693/article/details/125073548
本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!
云掣基于多年在运维领域的丰富时间经验,编写了《云运维服务白皮书》,欢迎大家互相交流学习:
《云运维服务白皮书》下载地址:https://fs80.cn/v2kbbq
想了解更多大数据运维托管服务、数据库运维托管服务、应用系统运维托管服务的的客户,欢迎点击云掣官网沟通咨询:https://yunche.pro/?t=shequ