【mongodb是什么数据库】MongoDB数据库高可用和分区解决方案

时间：2020-09-03 来源：MongoDB 阅读：

MongoDB是当前比较流行的文档型数据库，其拥有易使用、易扩展、功能丰富、性能卓越等特性。MongoDB本身就拥有高可用及分区的解决方案，分别为副本集(Replica Set)和分片(sharding)，下面我们主要看这两个特性。

1.副本集

有人说MongoDB副本集至少需要三个节点，但其实这句是有问题的，因为副本集中节点最少可以是一台，3.0之前最多12个节点，3.0开始节点数量能够达到50个。但节点数1个或者2个的时候，MongoDB就无法发挥副本集特有的优势，因此我们一般建议节点数大于3个。

首先，我们看一下MongoDB副本集的各种角色。

Primary: 主服务器，只有一组，处理客户端的请求，一般是读写

Secondary: 从服务器，有多组，保存主服务器的数据副本，主服务器出问题时其中一个从服务器可提升为新主服务器，可提供只读服务

Hidden：一般只用于备份节点，不处理客户端的读请求

Secondary-Only:不能成为primary节点，只能作为secondary副本节点，防止一些性能不高的节点成为主节点

Delayed：slaveDelay来设置，为不处理客户端请求，一般需要隐藏

Non-Voting：没有选举权的secondary节点，纯粹的备份数据节点。

Arbiter: 仲裁节点，不存数据，只参与选举，可用可不用

然后我们思考一下MongoDB副本集是通过什么方式去进行同步数据的，我们了解Oracle的DataGuar同步模式，我们也了解MySQL主从同步模式，他们都是传输日志到备库然后应用的方法，那么不难想象，MongoDB的副本集基本也是这个路子，这里就不得不提到同步所依赖的核心Oplog。Oplog其实就像MySQL的Binlog一样，记录着主节点上执行的每一个操作，而Secondary通过复制Oplog并应用的方式来进行数据同步。Oplog的大小是固定的，默认分配5%的可用空间(64位)，当然我们也可以用–oplogSize选项指定具体大小，设置合适的大小在生产应用中是非常重要的一个环节，大家可能疑惑为什么？这是因为Oplog和MySQL Binary不同，它是循环复用的，它又和Oracle的日志不同，没有多组重做日志，也没有归档日志。Oplog就是一个大小固定、循环复用的日志文件，当Secondary落后Primary很多，直到oplog被复写，那只能重新全量同步，而拉取全量同步代价特别高，直接影响Primary的读写性能。

大家还可能会问MongoDB副本集是实时同步吗？这其实也是在问数据库一致性的问题。MySQL的半同步复制模式保证数据库的强一致，Oracle DataGuard的最大保护模式也能够保证数据库的强一致，而MongoDB可以通过getLastError命令来保证写入的安全，但其毕竟不是事务操作，无法做到数据的强一致。

MongoDB副本集Secondary通常会落后几毫秒，如果有加载问题、配置错误、网络故障等原因，延迟可能会更大。

MongoDB副本集本身就持有故障切换(Failover)、手动切换(Switchover)以及读写分离的功能，大家可能会关心MongoDB副本集如何选举、如何防止脑裂等等问题，这个先别着急，放到下面去说。MongoDB副本集默认是把读写压力都请求到Primary节点上，但我们可以通过设置setSlaveOk来把读压力放在各个Secondary上，MongoDB驱动还提供五种读取策略(Read Preferences)，如下：