ReadConcern与WriteConcern

太阳2年前技术文章788

一、ReadConcern

1、ReadConcern vs ReadPreference

ReadPreference 主要控制从副本集哪个节点来读取数据,该参数可以实现读写分离、就近读取的功能

primary:            只从主节点读取数据(默认值)
primaryPreference:  优先从主节点读取数据,主节点不可用时从备份节点读取数据
secondary:          只从备份节点读取数据
secondaryPreference:优先从备份节点读取数据,没有备份节点的时候从主节点读取数据
nearest:            根据网络距离就近读取

ReadConcern 决定读取数据时,读取到的是什么样的数据

local:      能够读取到任意数据           
majority:   只能读取到【成功写入到大多数的数据】

使用:

readConcern: { level: <"majority"|"local"|"linearizable"> }


2、ReadConcern可以解决什么问题

ReadConcern可以避免[脏读]

    存在一种情况时,当parimary节点写入数据,该记录并没有同步到secodary节点。此时parimary节点挂掉了,重新恢复后parimary节点因故障未同步到大多数的记录就会被回滚掉,导致用户在故障前查询的记录为[脏数据]。

    当ReadConcern为majority模式时,保证客户端读取到的数据是[写入到大多数的数据],这时及时parimary节点挂掉了,该记录也不会被回滚掉,就避免掉了[脏读]。

3、ReadConcern实现原理

    ReadConcern要使用majority模式必须打开replication.enableMajorityReadConcern参数,开启该参数后secondary节点会启动一个snapshot线程,该线程会周期性的对当前的数据集进行snapshot(初始状态都为uncommited),并记录snapshot时最新oplog的时间戳,得到一个映射表。只有确保oplog已经同步到大多数节点时,snapshot的状态才会变更为commited。

4、MongoDB如何确定oplog已经写入大多数?

Parimary节点:

    secondary节点oplog在发生变化时,会通过replSetUpdatePosition命令将oplog的进度同步给parimary节点,而且心跳检测信息中也包含了oplog的信息。所以parimary节点可以很快或缺到secondary节点的oplog的信息,当达到[大多数]原则后,parimary节点更新snapshot的状态为comminted状态。期间无效的snapshot会做删除处理。

Secondary节点:

    secondary节点在拉取parimary节点的oplog信息时,parimary会将[最新一条oplog已经同步到大多数节点]的信息同步给secondary节点,secondary节点会根据这个信息来更新自己的snapshot的状态。

5、注意事项

1.ReadConcern只能保证客户端在读取数据时,该记录在大多数节点上已经更新,但是不能保证读取到的数据是已经更新了的最新记录
2.ReadPreference可以限定客户端读取到的数据规则
3.目前readConcern主要用于跟mongos与config server的交互上,参考 https://yq.aliyun.com/articles/58689?spm=a2c4e.11153940.blogcont60553.8.2a0e2e23TDmv68
4.使用readConcern需要配置replication.enableMajorityReadConcern选项
5.只有支持 readCommited 隔离级别的存储引擎才能支持 readConcern,比如 wiredtiger 引擎,而 mmapv1引擎则不能支持。(!)

二、WriteConcern

WriteConcern主要控制客户端写入策略。

1、WriteConcern选项

1.w:<number> 数据写入number个节点才向客户端确认
    {w:0}:         对客户端的写入不需要发送任何确认,适用于性能要求高,但是不关注正确性的场景
    {w:1}:         默认值,数据写入parimary节点就向客户端发送确定
    {w:majority}:  数据写入大多数后向客户端发送确认,适用于数据安全性要求比较高的场景

2.j:<boolean> 写入操作的journal持久化后再向客户端确认  
    {j:false}       默认false,如果要求parimary节点的journal日志持久化后再向客户端发送确认的化需要将该参数改为true。

3.wtimeout:<milseconds> 写入超时时间,大于1有效

2、{w:majority}理解

    1)Client向Primary发起请求,指定writeConcern为{w: "majority"},Primary收到请求,本地写入并记录写请求到oplog,然后等待大多数节点都同步了这条/批oplog(Secondary应用完oplog会向主报告最新进度)。

    2)Secondary拉取到Primary上新写入的oplog,本地重放并记录oplog。为了让Secondary能在第一时间内拉取到主上的oplog,find命令支持一个awaitData的选项,当find没有任何符合条件的文档时,并不立即返回,而是等待最多maxTimeMS(默认为2s)时间看是否有新的符合条件的数据,如果有就返回;所以当新写入oplog时,备立马能获取到新的oplog。

    3)Secondary上有单独的线程,当oplog的最新时间戳发生更新时,就会向Primary发送replSetUpdatePosition命令更新自己的oplog时间戳。

    4)当Primary发现有足够多的节点oplog时间戳已经满足条件了,向客户端发送确认。

相关文章

centos6下时间修改

1、手动修改1)使用date命令修改的时间是系统时间临时生效的,重启系统后失效,需要将当前时间和硬件时间同步后才可以持久生效。date -s "2012-05-23 01:01:01&quo...

Ambari Hive 创建函数无权限

Ambari Hive 创建函数无权限

1、创建udf函数参考文档:https://blog.csdn.net/helloxiaozhe/article/details/102498567如果已经编写好,请使用自己的。如果没有请参考以上链接...

CDH实操--CDH集成Trino(三)

CDH实操--CDH集成Trino(三)

1、将parcel包放到对应下载目录将parcel包放到/var/www/html/trino目录下修改httpd配置文件新增parcel文件类型然后通过命令启动httpd服务:systemctl s...

磁盘存储和文件系统详解

磁盘存储和文件系统详解

1、磁盘结构设备文件:关联至一个设备驱动程序,进而能够与之对应硬件设备进行通信I/O Ports:I/O 设备地址一切皆文件:open(),read(),write(),close()设备类型:块设备...

sql_mode参数

sql_mode参数

一、参数含义sql_mode是个很容易被忽视的变量,其本身主要就是一种语法校验规则 ,默认值是空值,在这种设置下是可以允许一些非法操作的,比如允许一些非法数据的插入。二、常用值含义1、ONLY_FUL...

SQL隐式转换导致索引失效_数据类型不一致

SQL隐式转换导致索引失效_数据类型不一致

2.数据类型不一致导致索引失效示例 SQL 如下,SQL 本身很简单,但通过查看执行计划可以发现,此时走的是主键索引,查看表结构发现表的 kemu 是有索引的,且过滤性相对较好。进一步核实,SQL 为...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。