MongoDB多文档事务详解
原子性(atomicity):事务作为一个整体被执行,包含在其中的对数据库的操作要么全部被执行,要么都不执行。一致性(consistency):事务应确保数据库的状态从一个一致状态转变为另一个一致状态。一致状态的含义是数据库中的数据应满足完整性约束。隔离性(isolation):多个事务并发执行时,一个事务的执行不应影响其他事务的执行。持久性(durability):已被提交的事务对数据库的修改应
文章目录
多文档事务详解
事务简介
数据库事务需要包含4个基本特性,即常说的ACID,具体如下:
- 原子性(atomicity):事务作为一个整体被执行,包含在其中的对数据库的操作要么全部被执行,要么都不执行。
- 一致性(consistency):事务应确保数据库的状态从一个一致状态转变为另一个一致状态。一致状态的含义是数据库中的数据应满足完整性约束。
- 隔离性(isolation):多个事务并发执行时,一个事务的执行不应影响其他事务的执行。
- 持久性(durability):已被提交的事务对数据库的修改应该是永久性的。
在MongoDB中,对单文档的操作是原子的。
由于可以在单个文档中使用内嵌文档或数组来获取数据之间的关系,而不必跨多个文档或集合进行范式化。
对于那些需要对多个文档(在单个或多个集合中)进行原子性读写的场景,MongoDB支持多文档事务。MongoDB4.2版本全面支持多文档事务。
MongoDB对事务的支持
事务属性 | 支持程度 |
---|---|
Atomocity 原子性 | 单表单文档 : 1.x 就支持; 复制集多表多行:4.0; 分片集群多表多行:4.2 |
Consistency 一致性 | writeConcern, readConcern (3.2) |
Isolation 隔离性 | readConcern (3.2) |
Durability 持久性 | Journal日志机制 和 Replication副本集机制 |
writeConcern
writeConcern 决定一个写操作落到多少个节点上才算成功。
语法格式:
{ w: <value>, j: <boolean>, wtimeout: <number> }
- w 选项会请求确认写入操作已传播到指定数量的
mongod
实例或带有指定标签的mongod
实例。 值可以为[majority,数字] - j 选项以请求确认写入操作已写入磁盘上日志
- wtimeout 选项用于指定时间限制,以防止写入操作无限期阻塞。
mongodb5.0版本开始,默认是w: majority
。而当w: majority
时,j的默认值取决于writeConcernMajorityJournalDefault的值,它默认为true,也就是说j: true
确认时要求对磁盘上日志进行写入操作。
w: 数据写入到number个节点才向用客户端确认
- {w: 0} 对客户端的写入不需要发送任何确认,适用于性能要求高,但不关注正确性的场景
- {w: 1} 默认的writeConcern,数据写入到Primary就向客户端发送确认
- {w: “majority”} 数据写入到副本集大多数成员后向客户端发送确认,适用于对数据安全性要求比较高的场景,该选项会降低写入性能
j: 写入操作的journal持久化后才向客户端确认
j的值 | 说明 |
---|---|
j 未指定 | 确认取决于 writeConcernMajorityJournalDefault 如果为 true ,则确认时要求对磁盘上日志 (j: true ) 进行写入操作。writeConcernMajorityJournalDefault 默认为 true 如果为 false ,则确认需要在内存中进行写入操作(j: false )。 |
j: true | 确认时要求对磁盘上日志进行写入操作。 |
j: false | 确认要求在内存中进行写入操作。 |
wtimeout: 写入超时时间,仅w的值大于1时有效。
- 当指定{w: }时,数据需要成功写入number个节点才算成功,如果写入过程中有节点故障,可能导致这个条件一直不能满足,从而一直不能向客户端发送确认结果,针对这种情况,客户端可设置wtimeout选项来指定超时时间,当写入过程持续超过该时间仍未结束,则认为写入失败。
测试
副本集中有三个节点,将其中一个节点改为延迟节点后进行测试
db.user.insertOne({name:"李四"},{writeConcern:{w:"majority"}})
#配置延迟节点
cfg = rs.conf()
cfg.members[2].priority = 0
cfg.members[2].hidden = true
cfg.members[2].secondaryDelaySecs = 60
rs.reconfig(cfg)
# 等待延迟节点写入数据后才会响应
db.user.insertOne({name:"王五"},{writeConcern:{w:3}})
# 超时写入失败
db.user.insertOne({name:"小明"},{writeConcern:{w:3,wtimeout:3000}})
注意事项
- 通常只会设置 majority,因为这是等待写入延迟时间最短的选择;
- 不要设置 writeConcern 等于总节点数,因为一旦有一个节点故障,所有写操作都将失败;
- writeConcern 虽然会增加写操作延迟时间,但并不会显著增加集群压力,因此无论是否等待,写操作最终都会复制到所有节点上。设置 writeConcern 只是让写操作等待复制后再返回而已;
- 应对重要数据应用 {w: “majority”},普通数据可以应用 {w: 1} 以确保最佳性能。
readPreference
readPreFerence决定使用哪一个节点进行读请求
可选值包括:
- primary: 只选择主节点,默认模式;
- primaryPreferred:优先选择主节点,如果主节点不可用则选择从节点;
- secondary:只选择从节点;
- secondaryPreferred:优先选择从节点, 如果从节点不可用则选择主节点;
- nearest:根据客户端对节点的 Ping 值判断节点的远近,选择从最近的节点读取。
场景举例
-
用户订单下单后马上跳转至订单详情页——primary/primaryPreferred。因为此时从节点可能还没复制到新订单;
-
用户查询自己下过的订单——secondary/secondaryPreferred。查询历史订单对 时效性通常没有太高要求;
-
生成报表——secondary。报表对时效性要求不高,但资源需求大,可以在从节点单独处理,避免对线上用户造成影响;
-
将用户上传的图片分发到全世界,让各地用户能够就近读取——nearest。每个地区的应用选择最近的节点读取数据。
配置
通过 MongoDB 的连接串参数:
# 连接参数后面添加readPreference=secondary 表示从备节点读取数据
mongodb://host1:27107,host2:27107,host3:27017/?replicaSet=rs0&readPreference=secondary
通过 MongoDB 驱动程序 API:
MongoCollection.withReadPreference(ReadPreference readPref)
Mongo Shell:
db.collection.find().readPref( "secondary" )
从节点读取测试
主节点写入{count:1} , 观察该条数据在各个节点均可见
[root@localhost ~]# mongosh --host rs0/localhost:28017 -u hushang -p 123456
rs0 [primary] test> db.user.insertOne({name: "hs2"},{writeConcern: {w: 1}})
在primary节点中调用readPref(“secondary”)查询从节点用直连方式(mongosh localhost:28017)会查到数据,需要通过mongosh --host rs0/localhost:28017方式连接复制集,参考: https://jira.mongodb.org/browse/SERVER-22289
在两个从节点分别执行 db.fsyncLock() 来锁定写入(同步)
# 解除锁定的方法为 db.fsyncUnlock()
rs0 [direct: secondary] test> rs.secondaryOk()
rs0 [direct: secondary] test> db.fsyncLock()
主节点写入一条新数据
# 主节点插入一条文档
rs0 [primary] test> db.user.insertOne({name: "hs3"},{writeConcern: {w: 1}})
# 主节点能查询到
rs0 [primary] test> db.user.find()
# 从节点查询不到
rs0 [primary] test> db.user.find().readPref("secondary")
# 从节点也查询一次,因为上面开启了同步写入锁定,索引新插入的数据从节点是读取不到的
rs0 [direct: secondary] test> db.user.find()
解除从节点锁定 db.fsyncUnlock()
rs0 [direct: secondary] test> db.fsyncUnlock()
此时主节点再查询就能查询到数据了
rs0 [primary] test> db.user.find().readPref("secondary")
扩展:Tag
**readPreference 只能控制使用一类节点。Tag 则可以将节点选择控制到一个或几个节点。**考虑以下场景:
- 一个 5 个节点的复制集;
- 3 个节点硬件较好,专用于服务线上客户;
- 2 个节点硬件较差,专用于生成报表;
可以使用 Tag 来达到这样的控制目的:
- 为 3 个较好的节点打上 {purpose: “online”};
- 为 2 个较差的节点打上 {purpose: “analyse”};
- 在线应用读取时指定 online,报表读取时指定 analyse。
# 为复制集节点添加标签
conf = rs.conf()
conf.members[1].tags = { purpose: "online"}
conf.members[2].tags = { purpose: "analyse"}
rs.reconfig(conf)
#查询
db.collection.find({}).readPref( "secondary", [ {purpose: "online"} ] )
模拟,我先把一台节点进行同步写入锁定
rs0 [direct: secondary] test> db.fsyncLock()
现在插入一条数据后再进行查询
注意事项
-
指定 readPreference 时也应注意高可用问题。例如将 readPreference 指定 primary,则发生故障转移不存在 primary 期间将没有节点可读。如果业务允许,则应选择 primaryPreferred;
-
使用 Tag 时也会遇到同样的问题,如果只有一个节点拥有一个特定 Tag,则在这个节点失效时将无节点可读。这在有时候是期望的结果,有时候不是。例如:
-
如果报表使用的节点失效,即使不生成报表,通常也不希望将报表负载转移到其他节点上,此时只有一个节点有报表 Tag 是合理的选择;
-
如果线上节点失效,通常希望有替代节点,所以应该保持多个节点有同样的 Tag;
-
- Tag 有时需要与优先级、选举权综合考虑。例如做报表的节点通常不会希望它成为主节点,则优先级应为 0。
readConcern
在 readPreference 选择了指定的节点后,readConcern 决定这个节点上的数据哪些是可读的,类似于关系数据库的隔离级别。可选值包括:
- available:读取所有可用的数据;
- local:读取所有可用且属于当前分片的数据;
- majority:读取在大多数节点上提交完成的数据;
- linearizable:可线性化读取文档,仅支持从主节点读;
- snapshot:读取最近快照中的数据,仅可用于多文档事务;
local 和 available
在复制集中 local 和 available 是没有区别的,两者的区别主要体现在分片集上。
当发生数据迁移时,分片A把一部分数据迁移至分片B,迁移进行中 此时分片B存在了一部分的数据。当readConcern为available时这一部分数据是能读取到的,当readConcern为local时这一部分数据读取不到。
majority
只读取大多数据节点上都提交了的数据。考虑如下场景:
- 集合中原有文档 {x: 0};
- 将x值更新为 1;
对于readConcern为majority时,primary必须要到t3时刻才能读取到{x: 1}的值;secondary1必须要到t5时刻才能读取到{x: 1}的值;secondary必须要到t6时刻
如何实现:
节点上维护多个 x 版本(类似于MVCC 机制),MongoDB 通过维护多个快照来链接不同的版本:
- 每个被大多数节点确认过的版本都将是一个快照;
- 快照持续到没有人使用为止才被删除;
测试readConcern: majority vs local
# 将复制集中的两个从节点使用 db.fsyncLock() 锁住写入(模拟同步延迟)
rs0 [direct: secondary] test> db.fsyncLock()
# 主节点插入一条数据
rs0 [primary] test> db.user.insert({name: "hs"},{writeConcern:{w:1}})
DeprecationWarning: Collection.insert() is deprecated. Use insertOne, insertMany, or bulkWrite.
{
acknowledged: true,
insertedIds: { '0': ObjectId("66a9bc98765490df764272fc") }
}
# readConcern为local的查询结果,能查询到数据
rs0 [primary] test> db.user.find().readConcern("local")
[ { _id: ObjectId("66a9bc98765490df764272fc"), name: 'hs' } ]
# readConcern为majority的查询结果,查询不到数据
# 使用 majority,只能查询到已经被多数节点确认过的数据
rs0 [primary] test> db.user.find().readConcern("majority")
rs0 [primary] test>
readConcern: majority 与脏读
MongoDB 中的回滚:
- 写操作到达大多数节点之前都是不安全的,一旦主节点崩溃,而从节点还没复制到该次操作,刚才的写操作就丢失了;
- 把一次写操作视为一个事务,从事务的角度,可以认为事务被回滚了。
所以从分布式系统的角度来看,事务的提交被提升到了分布式集群的多个节点级别的“提交”,而不再是单个节点上的“提交”。
在可能发生回滚的前提下考虑脏读问题:
- 如果在一次写操作到达大多数节点前读取了这个写操作,然后因为系统故障该操作回滚了,则发生了脏读问题;
所以使用 {readConcern: “majority”} 可以有效避免脏读
如何安全的读写分离
考虑如下场景:
- 向主节点写入一条数据;
- 立即从从节点读取这条数据。
思考: 如何保证自己能够读到刚刚写入的数据?
下述方式有可能读不到刚写入的订单
db.orders.insert({oid:101,sku:"kite",q:1})
db.orders.find({oid:101}).readPref("secondary")
使用writeConcern+readConcern majority来解决
db.orders.insert({oid:101,sku:"kite",q:1},{writeConcern:{w:"majority"}})
db.orders.find({oid:101}).readPref("secondary").readConcern("majority")
linearizable
只读取大多数节点确认过的数据。和 majority 最大差别是保证绝对的操作线性顺序
- 在写操作自然时间后面的发生的读,一定可以读到之前的写
- 只对读取单个文档时有效;
- 可能导致非常慢的读,因此总是建议配合使用 maxTimeMS;
snapshot
{readConcern: “snapshot”} 只在多文档事务中生效。
将一个事务的 readConcern 设置为 snapshot,将保证在事务中的读:
- 不出现脏读;
- 不出现不可重复读;
- 不出现幻读。
因为所有的读都将使用同一个快照,直到事务提交为止该快照才被释放。
小结
- available:读取所有可用的数据
- local:读取所有可用且属于当前分片的数据,默认设置
- majority:数据读一致性的充分保证,可能你最需要关注的
- linearizable:增强处理 majority 情况下主节点失联时候的例外情况
- snapshot:最高隔离级别,接近于关系型数据库的Serializable
事务隔离级别
开启事务语句
var session = db.getMongo().startSession()
session.startTransaction({ readConcern: {level: "majority"}, writeConcern: {w: "majority"}})
var coll = session.getDatabase("数据库名").getCollection("集合名")
# 之后的操作就通过coll变量去进行增删改查操作
事务完成前,事务外的操作对该事务所做的修改不可访问
db.tx.insertMany([{ x: 1 }, { x: 2 }])
var session = db.getMongo().startSession()
# 开启事务,readConcern默认的级别就是majority
session.startTransaction()
var coll = session.getDatabase("test").getCollection("tx")
# 注意这里使用的我上面定义的coll变量,而不是db.collection.XXX()了
# 事务内修改 {x:1, y:1}
coll.updateOne({x: 1}, {$set: {y: 1}})
#事务内查询 {x:1}
coll.findOne({x: 1}) //{x:1, y:1}
#事务外查询 {x:1}
db.tx.findOne({x: 1}) //{x:1}
#提交事务
session.commitTransaction()
# 或者回滚事务
session.abortTransaction()
如果事务内使用 {readConcern: “snapshot”},则可以达到可重复读 Repeatable Read
var session = db.getMongo().startSession()
session.startTransaction({ readConcern: {level: "snapshot"}, writeConcern: {w: "majority"}})
var coll = session.getDatabase('test').getCollection("tx")
coll.findOne({x: 1})
db.tx.updateOne({x: 1}, {$set: {y: 2}})
db.tx.findOne({x: 1})
coll.findOne({x: 1}) #事务外查询
session.abortTransaction()
事务超时机制
在执行事务的过程中,如果操作太多,或者存在一些长时间的等待,则可能会产生如下异常:
rs0 [direct: primary] test> session.commitTransaction()
MongoServerError: Transaction with { txnNumber: 1 } has been aborted.
原因在于,默认情况下MongoDB会为每个事务设置1分钟的超时时间,如果在该时间内没有提交,就会强制将其终止。该超时时间可以通过transactionLifetimeLimitSecond变量设定。
事务错误处理机制
-
两个事务修改同一个文档,晚修改的事务会报异常。异常 – 解决方案:重新开启事务即可
-
如果一个事务已经开始修改一个文档,在事务以外尝试修改同一个文档,则事务以外的修改会等待事务完成才能继续进行。
测试
# 开启事务
var session = db.getMongo().startSession()
session.startTransaction({ readConcern: {level: "majority"}, writeConcern: {w: "majority"}})
var coll = session.getDatabase('test').getCollection("tx")
执行修改语句
# 事务外执行
db.tx.update({_id: ObjectId("66a9bfdb765490df764272fd")},{$set: {y: 2}})
db.tx.find()
# 事务内执行
coll.update({_id: ObjectId("66a9bfdb765490df764272fd")},{$set: {y: 3}})
coll.find()
提交事务
session.commitTransaction()
但是经过测试,我发现事务外和事务内其实并不存在等待阻塞的情况,但两个事务操作同一条数据的确会报错
注意事项
- 可以实现和关系型数据库类似的事务场景
- 必须使用与 MongoDB 4.2及以上 兼容的驱动;
- 事务默认必须在 60 秒(可调)内完成,否则将被取消;
- 涉及事务的分片不能使用仲裁节点;
- 事务会影响 chunk 迁移效率。正在迁移的 chunk 也可能造成事务提交失败(重试 即可);
- 多文档事务中的读操作必须使用主节点读;
- readConcern 只应该在事务级别设置,不能设置在每次读写操作上。
SpringBoot整合Mongodb事务操作
编程式事务
import com.mongodb.ReadConcern;
import com.mongodb.ReadPreference;
import com.mongodb.TransactionOptions;
import com.mongodb.WriteConcern;
import com.mongodb.client.ClientSession;
import com.mongodb.client.MongoClient;
import com.mongodb.client.MongoClients;
import com.mongodb.client.MongoCollection;
import com.mongodb.client.model.Filters;
import com.mongodb.client.model.Updates;
import org.bson.Document;
import org.junit.jupiter.api.Test;
/**
* @Description: 多文档事务操作
* @Author 胡尚
* @Date: 2024/7/31 14:32
*/
public class TransactionTest extends LearnMongodbApplicationTest{
@Test
public void updateTest(){
// 连接复制集
MongoClient mongoClient = MongoClients.create("mongodb://hushang:123456@192.168.75.100:28017,192.168.75.100:28018,192.168.75.100:28019/test?authSource=admin&replicaSet=rs0");
// 获取两个collection集合对象
MongoCollection<Document> empCollection = mongoClient.getDatabase("test").getCollection("emp");
MongoCollection<Document> eventsCollection = mongoClient.getDatabase("test").getCollection("events");
// 事务操作配置
TransactionOptions transactionOptions = TransactionOptions.builder()
.writeConcern(WriteConcern.MAJORITY)
.readPreference(ReadPreference.primary())
.readConcern(ReadConcern.MAJORITY)
.build();
try(ClientSession clientSession = mongoClient.startSession()){
// 开启事务
clientSession.startTransaction();
try{
empCollection.updateOne(clientSession,
Filters.eq("_id", "66a9dbb8bb75fd99739d6aea"),
Updates.set("name", "hushang"));
int i = 1/0;
eventsCollection.insertOne(clientSession,
new Document("username", "hs1").append("status", new Document("new", "inactive").append("old", "Active")));
// 提交事务
clientSession.commitTransaction();
} catch (Exception e){
// 回滚事务
clientSession.abortTransaction();
}
}
}
}
进行测试,事务会正常回滚;如果把int i = 1/0;
注释掉,则能看到正常事务提交的执行结果
声明式事务
配置事务管理器
package com.hs.learn.config;
import com.mongodb.ReadConcern;
import com.mongodb.ReadPreference;
import com.mongodb.TransactionOptions;
import com.mongodb.WriteConcern;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.data.mongodb.MongoDatabaseFactory;
import org.springframework.data.mongodb.MongoTransactionManager;
/**
* @Description: mongodb的配置类
* @Author 胡尚
* @Date: 2024/7/31 14:52
*/
@Configuration
public class MongodbConfig {
@Bean
public MongoTransactionManager transactionManager(MongoDatabaseFactory factory) {
TransactionOptions transactionOptions = TransactionOptions.builder()
.readPreference(ReadPreference.primary())
.readConcern(ReadConcern.MAJORITY)
.writeConcern(WriteConcern.MAJORITY)
.build();
return new MongoTransactionManager(factory, transactionOptions);
}
}
编程测试service
package com.hs.learn.service;
import com.hs.learn.entity.Employee;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.mongodb.core.MongoTemplate;
import org.springframework.stereotype.Service;
import org.springframework.transaction.annotation.Transactional;
import java.util.Date;
/**
* @Description: 测试mongodb声明式事务
* @Author 胡尚
* @Date: 2024/7/31 14:58
*/
@Service
public class EmployeeService {
@Autowired
private MongoTemplate mongoTemplate;
// 使用Spring的声明式事务,就需要使用@Transactional注解
@Transactional(rollbackFor = Exception.class)
public void addEmployee(){
Employee employee1 = new Employee(1, "hushang1", 25, new Date(), "测试数据1");
Employee employee2 = new Employee(2, "hushang2", 25, new Date(), "测试数据2");
mongoTemplate.insert(employee1);
int i = 1/0;
mongoTemplate.insert(employee2);
}
}
测试
@Autowired
EmployeeService employeeService;
@Test
public void test(){
employeeService.addEmployee();
}
进行测试,事务会正常回滚;如果把int i = 1/0;
注释掉,则能看到正常事务提交的执行结果
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)