Redis 持久化机制 RDB

文若3年前技术文章931


前言

Redis 有两种持久化机制,分别是 RDB 与 AOF 本篇文章将介绍 RDB 的执行过程与应用。

1. RDB 简介

RDB 持久化是把当前进程数据生成快照保存到硬盘的过程,触发 RDB 持久化过程分为手动触发和自动触发。常用于全量备份和数据迁移。

2. 触发机制

2.1 手动触发

命令 save

执行 save 会堵塞当前 Redis 服务器,直到 RDB 结束为止,对数据量较大或者内存较大的实例,会堵塞较长时间,生产环境不建议使用。如果手动执行 save 命令,Redis 会记录下方日志。

127.0.0.1:6379> save
OK

* DB saved on disk

命令 bgsave

Redis 进程执行 fork 操作创建子进程,RDB 持久化过程由子进程负责,完成后自动结束。阻塞只发生在 fork 阶段,一般时间很短。如果手动执行 bgsave 命令,Redis 会记录下方日志。

* Background saving started by pid 90338
* DB saved on disk
* RDB: 0 MB of memory used by copy-on-write
* Background saving terminated with success

bgsave 对 save 堵塞进行优化,Redis 内部涉及 RDB 操作都是由 bgsave 完成。

2.2 自动触发

内部自动触发

从节点执行全量复制操作,主节点自动执行 bgsave 生成 RDB 文件发送给从节点。

执行 debug relad 重新加载 Redis 时,也会触发生产 RDB。

默认情况下,执行 shutdown 关闭 Redis 时,如果没有开启 AOF 持久化功能,则会触发 RDB。

参数设置触发

使用 save 相关配置,如 save m n 表示 m 秒内数据集存在 n 次修改时,触发一次 RDB。

127.0.0.1:6379> config get save
1) "save"
save 900 1 -- 900 秒内有数据变更则写入 RDB 文件
save 300 10  -- 300 秒内有 10 条以上数据变更则写入 RDB 文件
save 60 10000 -- 60 秒内有 10000 条以上数据变更则写入 RDB 文件

3. 参数设置

3.1 保存路径

通过设置 dir 可以配置 RDB 保存位置 dbfilename 可以设置文件名。

config set dir /opt/redis-5.0.12/backup
config set dbfilename bak_redis_db.rdb

3.2 备份压缩

Redis 默认采用 LZF 算法对生成的RDB文件做压缩处理,压缩后的文件远远小于内存大小,默认开启,可以通过 rdbcompression 参数配置。

config set rdbcompression{yes|no}

4. RDB 优缺点及原理

4.1 优势

RDB是一个紧凑压缩的二进制文件,代表 Redis 在某个时间点上的数据快照。非常适用于备份,全量复制等场景。加载恢复的速度远快于 AOF 机制。

4.2 缺点

RDB 方式数据没办法做到实时持久化/秒级持久化。因为 bgsave 每次运行都要执行 fork 操作创建子进程,属于重量级操作,频繁执行成本过高。

RDB 文件使用特定二进制格式保存,Redis 版本演进过程中有多个格式的 RDB 版本,存在老版本 Redis 服务无法兼容新版 RDB 格式的问题。

4.3 Copy-On-Write

通过使用 bgsave 命令,通过 fork 操作创建子进程,可以共享主线程所有的内存数据,执行后则开始进行 copy 数据,写入 rdb 文件中。期间如果有读操作,可以正常响应,与 bgsave 子进程互不影响,期间如果有修改操作,例如修改一块数据,这块数据就会被复制一份,生成这块数据的副本,主线程在这块数据副本上操作,不影响 bgsave 子进制的 copy 操作。

该机制为 Copy-On-Write 写时复制,可以减少 RDB 期间对 Redis 正常读写的影响。

风险点:执行 bgsave 命令,如果期间 Redis QPS 非常高,写入频繁,就需要更多的内存,来维护写时复制。

5. RDB 迁移测试

5.1 环境说明

系统版本:CentOS Linux release 7.8.2003 (Core)

Redis 版本:Redis 5.0.0

5.2 数据导出

redis-cli -h {source_redis_address} -p 6379 -a {password} --rdb {output.rdb}

5.3 数据导入

Redis 启动时会检查是否开启并且有 AOF 文件,如果有会直接加载 AOF 如果没有才会去寻找是否有 RDB 文件备份文件,所以我们将 RDB 文件加载到一个新 Redis 实例上,需要临时关闭 AOF 机制。

-- 关闭 AOF
config set appendonly no
-- 查询 AOF
config get appendonly
  1. 查询目标端路径参数,路径 dir 参数,文件名 dbfilename 参数。

127.0.0.1:6379> config get dir
1) "dir"
2) "/usr/local/redis-5.0.0"
127.0.0.1:6379> config get dbfilename
1) "dbfilename"
2) "bak_redis_db.rdb"
127.0.0.1:6379>
  1. 关闭目标端 Redis 服务。

redis-cli shutdown
  1. 上传 RDB 文件到目标端服务器,路径和文件名分别与目标端 dir 和 dbfilename 参数保持一致。

  2. 启动目标端 Redis 服务。

  3. 检查 key 数量,核实是否迁移成功。

dbsize
  1. 数据一致性校验,参考 Redis-full-check 工具。


相关文章

Pod终止-preStop

由于 Pod 所代表的是在集群中节点上运行的进程,当不再需要这些进程时允许其体面地 终止一般不应武断地使用 KILL 信号终止它们设计的目标是令你能够请求删除进程,并且知道进程何时被终止,同时也能够确...

HDP-Yarn开启CPU调度和隔离

HDP-Yarn开启CPU调度和隔离

进入到ambari主界面 点击yarn 点击config CPU Scheduling and Isolation 设置为enable修改高级配置点击ADVANCED搜索需要修改的配yarn.node...

大数据集群部署规划(四)组件建议规格

类型指标名称规格说明HDFS单对NameNode最大文件数1亿-单DataNode最大block数500万GC参数 -Xmx32G单个DataNode磁盘最多block数50万-单个目录下最多文件目录...

pod内无法访问slb的监听

pod内无法访问slb的监听

问题背景在A账号下的k8s集群中有个nginx 应用,需要去访问B账号下内网slb代理的一个服务。B账号下的slb有多条监听,测试发现只有个别监听可以telnet通,其余监听telnet均不通。可能是...

mysql 导出 csv 参数 secure_file_priv 设置

mysql 导出 csv 参数 secure_file_priv 设置

一、功能secure_file_priv 参数是用来限制数据导入和导出操作的效果,例如由LOAD data和SELECT…INTO OUTFILE语句和LOAD_FILE()函数。只有具有“FILE”...

Spark thriftserver对接cdh hive

Spark thriftserver对接cdh hive

1、背景客户需要使用spark的thriftserver来通过beeline或者jdbc 来使用spark sql环境: spark 3.2.0hive: 2.1.1-cdh6.3.2hadoop:...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。