linuxsir首页 LinuxSir.Org | Linux、BSD、Solaris、Unix | 开源传万世,因有我参与欢迎您!
网站首页 | 设为首页 | 加入收藏
您所在的位置:主页 > Linux基础建设 >

MongoDB Oplog深入理解

时间:2019-05-13  来源:未知  作者:admin666

Oplog 概念

Oplog 是用于存储 MongoDB 数据库所有数据的操作记录的(实际只记录增删改和一些系统命令操作,查是不会记录的),有点类似于 mysql 的 binlog 日志。

Oplog 的存在极大地方便了 MongoDB 副本集的各节点的数据同步,MongoDB 的主节点接收请求操作,然后在 Oplog 中记录操作,次节点异步地复制并应用这些操作。

Oplog 的默认储存大小

对于 unix 系统和 windows 系统

Storage EngineDefault Oplog SizeLower BoundUpper Bound
In-Memory Storage Engine 5% of physical memory 50 MB 50 GB
WiredTiger Storage Engine 5% of free disk space 990 MB 50 GB
MMAPv1 Storage Engine 5% of free disk space 990 MB 50 GB

Oplog 存储在 local 库的 oplog.rs 集合里面。对于一般的线上环境来说,默认的 Oplog 值就已经足够了。当达到储存大小的日志时,新的记录会将老的记录覆盖。

但是我们系统中如果存在以下操作的话,那么我们就可能需要设置更大的 Oplog 值来避免数据的丢失(在副本集中数据同步过程):

  • 一次更新多个文件
  • 删除与插入同样数量的数据
  • 大量地更新现有的数据

从MongoDB 4.0开始, Oplog 可以超过其配置的大小限制,以避免删除

一旦mongod第一次创建了 Oplog ,更改--oplogSize选项将不会影响 Oplog 的大小。replSetResizeOplog使您可以动态调整 Oplog 的大小,而无需重新启动该mongod过程。

oplog 中每个操作都是 幂等性 的,也就是说,无论是对目标数据库应用一次还是多次,oplog操作都会产生相同的结果。这样就保证了数据的一致性。

Oplog 常用命令

查看 Oplog 的状态:rs.printReplicationInfo()

fymongodb:PRIMARY> rs.printReplicationInfo()
configured oplog size:   15000MB
log length start to end: 7437secs (2.07hrs)
oplog first event time:  Thu Apr 11 2019 09:40:31 GMT+0800 (CST)
oplog last event time:   Thu Apr 11 2019 11:44:28 GMT+0800 (CST)
now:                     Thu Apr 11 2019 11:44:35 GMT+0800 (CST)

如何查看当前的 Oplog 存储设置的大小:db.oplog.rs.stats().maxSize

fymongodb:PRIMARY> use local
fymongodb:PRIMARY> db.oplog.rs.stats().maxSize
NumberLong("15728640000")

查看 Oplog 最大大小和现在占用的大小,以及记录时长和时间 :db.getReplicationInfo()

fymongodb:PRIMARY> db.getReplicationInfo()
{
    "logSizeMB" : 15000,
    "usedMB" : 0.09,
    "timeDiff" : 7797,
    "timeDiffHours" : 2.17,
    "tFirst" : "Thu Apr 11 2019 09:40:31 GMT+0800 (CST)",
    "tLast" : "Thu Apr 11 2019 11:50:28 GMT+0800 (CST)",
    "now" : "Thu Apr 11 2019 11:50:29 GMT+0800 (CST)"
}

更改副本集成员的 Oplog 大小,更改的值要大于等于990MB,这里设置为1500MB : db.adminCommand({replSetResizeOplog: 1, size: 15000})

fymongodb:PRIMARY> db.adminCommand({replSetResizeOplog: 1, size: 15000})
{
    "ok" : 1,
    "operationTime" : Timestamp(1554953918, 1),
    "$clusterTime" : {
        "clusterTime" : Timestamp(1554953918, 1),
        "signature" : {
            "hash" : BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),
            "keyId" : NumberLong(0)
        }
    }
}
# 如果我们通过上面命令更改了 Oplog 的大小,系统是不会自动回收原始分配给 Oplog 的磁盘空间,我们需要使用 compact 来回收,在操作 compact 命令时,副本集成员是无法进行同步数据的。建议在进行回收的时候,不要对数据库进行写入,我们可以通过 rs.stepDown() 来关闭所有打开的连接。
use local
db.runCommand({ "compact" : "oplog.rs" })

# 执行报错的话 :"will not run compact on an active replica set primary as this is a slow blocking operation. use force:true to force"
db.runCommand({ "compact" : "oplog.rs" ,"force":true})

Oplog 日志 解析

Oplog 的值是储存在 local 库下的 集合 oplog.rs 里的。我们可以分析其中的一条日志,看到到底记录了写什么。

# 获取日志
use local
db.polog.rs.find()
# 日志内容
{ "ts" : Timestamp(1554948714, 1), "t" : NumberLong(7), "h" : NumberLong("5670178969026212077"), "v" : 2, "op" : "i", "ns" : "djx.a", "ui" : UUID("f0a8c38d-af6b-4fb1-a109-775455dd7f19"), "wall" : ISODate("2019-04-11T02:11:54.602Z"), "o" : { "_id" : ObjectId("5caea26adebe94533fdb42a9"), "name" : "youju" } }

Oplog 的日志由 key value 组成。  
ts 的值: 表示该日志的时间戳
op 的值: i 表示 insert ,u 表示 update, d 表示 delete, c 表示的是 db cmd, db 表示声明当前数据库 (其中ns 被设置成为=>数据库名称+ '.'), n 表示 noop,,即空操作,其会定期执行以确保时效性
ns 的值: 表示操作所在的数据库和集合。
ui 的值: 表示当前登录用户的会话 id 值。
wall 的值: 表示该操作的执行时间,utc时间。
o 的值: 表示操作的内容,如果是插入,就会将插入的数据放到该位置。示例日志就是插入了一条数据{"name":"youju"}

Linux公社的RSS地址:https://www.linuxidc.com/rssFeed.aspx

友情链接
  • Mozilla发布Firefox 67.0.4,修复沙箱逃逸漏洞
  • 蚂蚁金服正式成为CNCF云原生计算基金会黄金会员
  • Firefox 68将采用Microsoft BITS安装更新
  • OpenSSH增加对存储在RAM中的私钥的保护
  • 谷歌想实现自己的curl,为什么?
  • Raspberry Pi 4发布:更快的CPU、更大的内存
  • Firefox的UA将移除CPU架构信息
  • Ubuntu放弃支持32位应用程序实属乌龙,Steam会否重回Ubuntu怀抱
  • Qt 5.13稳定版发布:引入glTF 2.0、改进Wayland以及支持Lottie动
  • 红帽企业Linux 7现已内置Redis 5最新版
  • Slack进入微软内部禁用服务清单,GitHub也在其列?
  • 安全的全新编程语言V发布首个可用版本
  • Windows Terminal已上架,快尝鲜
  • 阿里巴巴微服务开源生态报告No.1
  • 面世两年,Google地球将支持所有基于Chromium的浏览器
  • 推进企业容器化持续创新,Rancher ECIC千人盛典完美收官
  • CentOS 8.0最新构建状态公布,或于数周后发布
  • Debian移植RISC
  • 微软拆分操作系统的计划初现雏形
  • Oracle发布基于VS Code的开发者工具,轻松使用Oracle数据库
  • Ubuntu 19.10停止支持32位的x86架构
  • 微软为Windows Terminal推出全新logo
  • 联想ThinkPad P系列笔记本预装Ubuntu系统
  • 微软发布适用于Win7/8的Microsoft Edge预览版
  • 启智平台发布联邦学习开源数据协作项目OpenI纵横
  • 经过六个多月的延迟,微软终于推出Hyper
  • ZFS On Linux 0.8.1 发布,Python可移植性工作
  • DragonFly BSD 5.6.0 发布,HAMMER2状态良好
  • Linux Kernel 5.2
  • CentOS 8.0 看起来还需要几周的时间
  • 百度网盘Linux版正式发布
  • PCIe 6.0宣布:带宽翻倍 狂飙至256GB/s
  • PHP 7.4 Alpha 发布,FFI扩展,预加载Opcache以获得更好的性能
  • Canonical将在未来的Ubuntu版本中放弃对32位架构的支持
  • Scala 2.13 发布,改进的编译器性能
  • 微软的GitHub收购了Pull Panda,并且使所有订阅完全免费
  • Windows Subsystem for Linux 2 (WSL 2)现在适用于Windows 10用
  • Debian 10 “Buster”的RISC
  • MariaDB宣布发布MariaDB Enterprise Server 10.4
  • DXVK 1.2.2 发布,带来微小的CPU开销优化
  • DragonFlyBSD 5.6 RC1 发布,VM优化,默认为HAMMER2
  • PrimeNG 8.0.0 发布,支持Angular 8,FocusTrap等
  • GIMP 2.10.12 发布,一些有用的改进
  • 清华大学Anaconda 镜像服务即将恢复
  • Debian GNU/Linux 10 “Buster” 操作系统将于2019年7月6日发布
  • 时时彩论坛
  • 五星体育斯诺克
  • 北单比分直播
  • 河北11选5走势图
  • 福建体彩36选7开奖结果
  • 九龙图库下载