分片
在Mongodb里面存在另一种集群,就是分片技术,可以满足MongoDB数据量大量增长的需求。
当MongoDB存储海量的数据时,一台机器可能不足以存储数据也足以提供可接受的读写吞吐量。这时,我们就可以通过在多台机器上分割数据,使得数据库系统能存储和处理更多的数据。
为什么使用分片
- 复制所有的写入操作到主节点
- 延迟的敏感数据会在主节点查询
- 单个副本集限制在12个节点
- 当请求量巨大时会出现内存不足。
- 本地磁盘不足
- 垂直扩展价格昂贵
MongoDB分片
下图展示了在MongoDB中使用分片集群结构分布:
上图中主要有如下所述三个主要组件:
-
Shard:
用于存储实际的数据块,实际生产环境中一个shard server角色可由几台机器组个一个relica set承担,防止主机单点故障
-
Config Server:
mongod实例,存储了整个 ClusterMetadata,其中包括 chunk信息。
-
Query Routers:
前端路由,客户端由此接入,且让整个集群看上去像单一数据库,前端应用可以透明使用。
具体实例
采用三个shard一个配置服务
1.首先启动三个数据库服务器端口分别是:55555,55556,55557,host:localhost.
./mongod --port 55555 --dbpath=data/share1 --logpath=data/share1/logs/s1.log --logappend --fork
./mongod --port 555556--dbpath=data/share2 --logpath=data/share2/logs/s2.log --logappend --fork
./mongod --port 55557 --dbpath=data/share3 --logpath=data/share3/logs/s3.log --logappend --fork
2.启动配置服务器
./mongod --port 55558 --dbpath=data/config --logpath=data/config/logs/cnf.log --logappend --fork
3.启动路由服务.
./mongos --port 55554 --dbpath=data/share --logpath=data/share/logs/route.log --logappend --fork --configdb localhost:55558 --chunkSize 500
其中chunkSize为分片的大小,配置服务主要存储有路由信息
4.添加shard
use admin
db.runCommand({addshard:"localhost:55555"})
db.runCommand({addshard:"localhost:55556"})
db.runCommand({addshard:"localhost:55557"})
db.runCommand({enablesharding:"test"})//数据库test有分片能力
db.runCommand({shardcollection:"test.log",key:{id:1,time:1}})//指定文档中数据库对应的表通过什么分片.这里是test中log表根据id和time分片.
5.查看分片状态
db.runCommand({listshards:1})