本文介绍在windows环境下如何搭建一个高可用性的mongodb集群。系统环境为win7,mongodb版本为3.6.3。
本文采用的是分片+副本集的方式搭建集群,将分别介绍如何使用副本集和分片来提高可用性。
一、副本集
mongodb的副本集是维护同一个数据集合的多个mongod进程的集合,提供了数据的冗余,提高了可用性,在某些情况下也可以提高读容量。
mongodb官网相关文档:https://docs.mongodb.com/manual/replication/
1.1副本集结构
副本集有三种角色,分别为主节点、副本节点和仲裁节点(可选)。
主节点具有完全的读写操作,并且只有主节点可以进行写操作。
副本节点同步主节点的oplog,保持数据一致。
仲裁节点不保存数据副本,只在选举主节点的投票中有投票权。
1.2部署副本集
这里介绍如何在测试或开发环境中部署副本集。
如果需要限制ip访问,可以使用bind_ip或在mongod.cfg文件中配置。
mongod --bind_ip localhost,198.51.100.1
1.2.1创建必要文件夹
首先创建必要的文件夹,比如db文件夹,log文件夹。这里可以通过命令创建,也可以直接通过文件管理来创建。
1.2.2启动mongod实例
分别对应的副本集节点启动mongod实例,例如:
mongod --replSet rs0 --port 27017 --dbpath /data/db --logpath /data/log/mongod.log --smallfiles --oplogSize 128
replSet指定了副本集的名字,port指定了实例运行的端口,dbpath指定了数据库存储位置,logpath指定了日志存储位置。
smallfiles和oplogSize的设定可以防止在测试或开发环境中占用太多资源。
1.2.3初始化副本集
通过mongo shell或者驱动程序连接到某一个mongod实例。
运行初始化副本集命令:
var rsconf = {
_id: "rs0",
members: [
{
_id: 0,
host: "<hostname>:27017"
},
{
_id: 1,
host: "<hostname>:27018"
},
{
_id: 2,
host: "<hostname>:27019"
}
]
} rs.initiate(rsconf)
可以通过rs.conf(),rs.status()查看副本集状态。
二、分片
分片将数据进行水平分割,提供了一种处理大数据量数据集合和高吞吐量的方式。
2.1分片群集结构
分片群集由三部分构成:
1.shard,存储了分片数据,可部署成一个副本集。
2.mongos,路由器,连接客户端和分片群集,使分片操作对客户端透明。可部署成一个副本集。
3.config server,配置服务器,存储元数据和配置数据。3.4以后必须部署成副本集。
2.2部署分片
2.2.1部署配置服务器副本集
和配置普通副本集唯一不同的是,部署配置服务器副本集需要指定角色为configsvr。
mongod --configsvr --port 27017 --replSet myconfig --dbpath /data/config --logpath /data/log/mongod.log --smallfiles --oplogSize 128
2.2.2部署分片服务器副本集
和配置普通副本集唯一不同的是,部署配置服务器副本集需要指定角色为shardsvr。
mongod --shardsvr --port 28017 --replSet myshard --dbpath \data\db --logpath \data\log\mongod.log --smallfiles --oplogSize 128
2.2.3部署路由副本集
和配置普通副本集不同的是启动的为mongos实例。
mongos --configdb myconfig/localhost:27017,localhost:27018,localhost:27019 --port 30000 --replSet mymongos --logpath /data/log/mongod.log
2.2.4添加分片
首先通过mongo shell或者驱动连接到mongos实例。
可以修改chunk大小:
use config
db.settings.save( { _id:"chunksize", value: 1 } )
将分片添加到mongos:
sh.addShard( "myshard/localhost:28017,localhost:28018")
2.2.5设置分片
设置数据库分片:
sh.enableSharding("test")
设置集合分片:
分类分片,根据分片键的值范围进行分片:
sh.shardCollection("test.users", { "username" : 1 } )
哈希分片,根据分片键的哈希值进行分片:
sh.shardCollection("test.users", { "username" : "hashed" } )
三、测试
操作mongos插入数据,查看自动分区结果。
var list = ["a","b","c","d","e","f","g","h","i","j","k","l","m","n",
"o","p","q","r","s","t","u","v","w","x","y","z"];
for (var i = 0; i < 100000; i++){
var index = i % 26;
var user = {"username": list[index], "saysomething": "hello"};
db.getCollection("users").insert(user);
}
分片结果:
随着数据插入量的增多,达到块所能存储的最大值后,会形成更多的块:
在数据较少时,各分片之间的数据量差距可能较大。这种差距随着数据量的增大会逐渐缩小,趋近于平衡。