复制集（Replication Set），也叫副本集；作用是把一份数据同时保存在多台服务器上，保证数据的安全，不发生丢失；

示例

启动服务器

通过指定 replSet选项启动三台Mongo服务器，端口号是 27017， 27018， 27019；指定加入的复制集名称为 demo；

./bin/mongod --dbpath master/data --logpath master/log/0923.log --port 27017 --fork --replSet demo

./bin/mongod --dbpath slave1/data --logpath slave1/log/0923.log --port 27018 --fork --replSet demo

./bin/mongod --dbpath slave2/data --logpath slave2/log/0923.log --port 27019 --fork --replSet demo

此时，在三台服务器上分别键入rs.status()命令，均报“未初始化”的错误；

启动服务器的另外一种方式是通过配置文件启动；举个例子，这里的27018以配置文件启动；

配置文件如下所示：

dbpath=/home/mongodb/slave1/data             # 数据存放目录
logpath=/home/mongodb/slave1/log/0923.log    # 日志存放路径
pidfilepath=/home/mongodb/slave1/slave1.pid  # 进程文件，方便停止mongodb
directoryperdb=false      # 为每一个数据库按照数据库名建立文件夹存放
logappend=true                               # 以追加的方式记录日志
replSet=demo                                 # Replication Set 的名称
#bind_ip=127.0.0.1                           # 限制只允许某一特定IP来访问，逗号隔开
port=27018                                   # 进程所使用的端口号，默认为27017
oplogSize=10000          # mongodb操作日志文件的最大大小。单位为Mb，默认为硬盘剩余空间的5%
fork=true                                    # 以后台方式运行进程                  
noprealloc=false                             # 不预先分配存储                      
smallfiles=false                             # 当提示空间不够时添加此参数

初始化

登入任意一台机器的 MongoDB 执行，因为是全新的复制集，所以可以任意进入一台执行；要是一台有数据，则需要在有数据上执行；要多台有数据则不能初始化。

笔者选择在27017这台MongoDB服务器进行初始化

rs.initiate({
    _id:'demo',  // 复制集名称
    members:    // 复制集服务器列表
    [
        {
	    _id:0, // 服务器的唯一 ID
	    host:'192.168.1.168:27017' // 服务器的地址
        },
        {
	    _id:1,
	    host:'192.168.1.168:27018'
        },
        {
	    _id:2,
	    host:'192.168.1.168:27019'
        },
    ]
});

这样，三台服务器都加入了demo复制集；此时主节点27017可以进行读写，从节点27018和27019不可以读写；所有的写操作只能在主节点上进行；

那如何才能在从节点27018上读数据呢？在27018上键入rs.slaveOk()，这样就可以进行读操作；

注：可以通过rs.status()查看复制集状态；通过rs.config()查看复制集的配置信息；通过db.isMaster()查看是否是主节点信息；

添加从节点

先启动想要添加的从节点服务器，笔者是本地的27020服务器，同时指定相要加入的复制集名称；

1	./bin/mongod --dbpath slave3/data --logpath slave3/log/0923.log --port 27020 --fork --replSet demo

主节点27017配置添加：

1	rs.add('192.168.1.168:27020');

此时，通过键入rs.status()可以看到members成员有四位，包括这台新的27020从节点服务器；

如果想要移除27020从节点服务器，即可成功从demon复制集中移除该服务器；

1	rs.remove('192.168.1.168:27020');

模拟主服务器故障

目前环境：

27017: Primary主服务器
27018: SECONDARY从服务器
27019: SECONDARY从服务器

在系统命令行上，手动drop掉主服务器

lsof -i:27017 | sed '1d' | while read line
do
    echo $line | awk '{print $2}' | xargs kill -9
done

或者在主服务器上执行下面的语句

1	db.shutdownServer()

此时，在通过rs.status()查看环境

27017: 离线（not reachable/healthy）
27018: SECONDARY从服务器
27019: Primary主服务器

这里，为什么在主服务器27017服务器挂了之后，会选择27019做新的主服务器呢，这是由MongoDB服务器内部的多数投票算法，即每台服务器会为secondary从节点服务器进行投票，票数多的从节点服务器会成为新的Primary服务器；

笔者这里很幸运，两台从节点服务器27018和27019都选择了27019作为新的从节点服务器；另外一种可能是 27018和27019各得一票，这样会导致无法选举出新Primary服务器; 所以建议复制集的服务器数目为奇数，如果碰巧是偶数，可以添加一台仲裁节点服务器；

添加仲裁节点

仲裁节点是一种特殊的节点，它本身并不存储数据，主要的作用是决定哪一个从节点在主节点挂掉之后提升为主节点，所以客户端不需要连接此节点。

仲裁节点服务器启动，

1	./bin/mongod --dbpath arbiter/data --logpath arbiter/log/0923.log --port 27021 --fork --replSet demo

主服务器的配置上添加仲裁节点信息：

1	demo:PRIMARY> rs.addArb('192.168.1.168:27021')

手动设置`Primay`服务器

将27017服务器重启；

此时，在通过rs.status()查看环境

27017: SECONDARY从服务器
27018: SECONDARY从服务器
27019: Primary主服务器
27021: Arbiter仲裁服务器

如何能将当前的服务器从27019切换回27017服务器呢？

通过修改priority的值来实现（默认的优先级是1（0-100），priority的值设的越大，就优先成为主）；

在27019主节点上执行

1
2
3

Primary > config=rs.conf()
Primary > config.members[0].priority = 3
Primary > rs.reconfig(config)

注意：第2步members大括号里面的成员和_id是没有关系的，而是rs.conf查出来节点的数值的顺序；

原理

主节点的操作记录成为oplog（operation log）。 oplog存储在一个系统数据库local的集合oplog.rs中，这个集合的每个文档都代表主节点上执行的一个操作。我们重新向主数据库服务器中插入一条数据，然后查看这个集合可以看到：

1 2	use local db.getCollection('oplog.rs').find({})

文档中的字段含义：

ts：8字节的时间戳，由4字节 unix timestamp + 4字节自增计数表示

h：未知

v：未知

op：操作类型，i表示insert；u表示update；d表示delete；c表示db cmd；n表示no op, 空操作，其会定期执行以确保时效性；

ns：操作所在的namespace

o：操作所对应的document,即当前操作的内容（比如更新操作时要更新的的字段和值）

从服务器会定期从主服务器中获取oplog记录，然后在本机上执行！

对于存储oplog的集合，MongoDB采用的是固定集合，也就是说随着操作过多，新的操作会覆盖旧的操作！这样做也是有道理的，不然，这个集合占用的空间就无法估算了！我们在启动服务时，可以通过选项--oplogSize来指定这个集合的大小，单位是MB，在Windows平台下，默认MongoDB会使用数据库安装分区可用空间的5%作为这个集合的大小！

附录

属性说明

‘	成为`Primary`	对客户端可见	参与同步	延迟同步	复制数据
`Primary`	√	√	√		√
`Secondary`		√	√		√
`Hidden`			√		√
`Delayed`		√	√	√	√
`Arbiters`			√
`Non-Voting`	√	√			√

参考阅读

DrifterJ’s Stash的博客

示例