Kyoto Cabinet(DBM) + Kyoto Tycoon(网络层)

时间:2024-05-25 20:04:08
项目原地址kyotocabinet: http://fallabs.com/kyotocabinet/       kyototycoon:   http://fallabs.com/kyototycoon/
一. 安装

前注:没使用最新版本,因为最新版本似乎存在环境依赖的bug,编译N多错误,很难通过。

需要先安装zlib yum install zlib-devel
(1)安装kyotocabinet

mkdir -p /data/software/
cd /data/software/
wget
http://fallabs.com/kyotocabinet/pkg/kyotocabinet-1.2.76.tar.gz
tar xvzf
kyotocabinet-1.2.76.tar.gz
cd kyotocabinet-1.2.76 
./configure 
make
make install
cd ../

(2)安装kyototycoon
cd /data/software/
wget
http://fallabs.com/kyototycoon/pkg/kyototycoon-0.9.56.tar.gz
tar xvzf
kyototycoon-0.9.56.tar.gz
cd kyototycoon-0.9.56 
./configure 
make
make install

cd ../
二.使用kchashtest生成一亿条测试数据
(生成的测试数据key为8位数字,value为3位数字)

kchashtest order -bnum 150000000 -msiz 2g -set
/data/tycoon/casket1.kch  100000000

kchashtest较影响性能的几个参数:
  -bnum
指定哈希表的桶数量。官方推荐是记录数的两倍或者更高。
  -msize 指定内存映射区域大小。
  -dfunit
设定一个值,当碎片数超过这个值系统就进行碎片整理。
  -dmn   以daemon方式启动。
  -th num : 指定线程数

可能遇到 kchashtest: error while loading shared libraries: libkyotocabinet.so.16: cannot open shared object file: No such file or directory 的问题。
解决方法: 拷贝源文件到 /usr/lib下。 cp /data/software/kyotocabinet-1.2.76/libkyotocabinet.so.16 /usr/lib/

生成测试数据后以ktserver模式启动(ktserver参数意义见文章尾)
ktserver -host 192.168.2.70 -port
1978 -tout 10 -log /data/tycoon/ca.log -ls -dmn -pid /data/tycoon/ktserver.pid
/data/tycoon/casket1.kch#opts=1#bnum=150000000#msiz=2g#dfunit=8

ktsever较影响性能的几个参数:
  -bnum 指定哈希表的桶数量。官方推荐是记录数的两倍或者更高。
  -msize
指定内存映射区域大小。
  -dfunit 设定一个值,当碎片数超过这个值系统就进行碎片整理。
  -dmn   以daemon方式启动。

  -th num : 指定线程数 默认是 16

可能会遇到 ktserver: error while loading shared libraries: libkyototycoon.so.2: cannot open shared object file: No such file or directory 的问题,解决办法:
 拷贝源文件到 /usr/lib下。 cp /data/software/kyototycoon-0.9.56/libkyototycoon.so.2 /usr/lib/

三. 日常维护及使用
关闭ktserver
kill -TERM `cat
/data/tycoon/ktserver.pid `
Ktserver切割日志
mv -f
/data/tycoon/ktserver.log /data0/tycoon/ktserver.log.`date '+%Y%M%d%H%M%S'`

kill -HUP `cat /data/tycoon/ktserver.pid`
应用
使用http 客户端

由于每个数据库操作都经由http 调用,你可以使用任何http 客户端,诸如curl 命令来操作
数据库。
例:
添加数据

curl "http://192.168.2.70:1978/rpc/set?key=japan&value=tokyo"
读取数据

curl "http://192.168.2.70:1978/rpc/get?key=japan"
删除数据
curl
"http://192.168.2.70:1978/rpc/remove?key=japan"
除了上述RPC风格外还支持RESTfull风格

例:
添加数据
echo -n tokyo | curl -X PUT -T -
"http://192.168.2.70:1978/japan"
读取数据
curl
"http://192.168.2.70:1978/japan"
tokyo
删除数据
curl -X DELETE
"http://192.168.2.70:1978/japan"

四. 主从模式的配置及功能性测试
注意事项

1.主库必须记录更新日志。
2.主库必须指定唯一的id 号。
-sid num : 指定服务器server id
号(当使用主辅模式时,每台ktserver 需要不同
的ID 号)
3.从库也必须记录更新日志,当主库宕机时,从库就变成主库。

4.从库必须指定唯一的server id 号
5.从库必须指定主库的端口号和地址。
6.从库必须指定复制时间戳文件。

下面的一个主从实例,主库端口192.168.2.70:1978,从库端口192.168.2.80:1978
首先创建一个主库实例

ktserver -dmn -host 192.168.2.70 -port 1978 -ulog
/data/tycoon/0001-ulog -sid 1  -rts /data/tycoon/001.rts
/data/tycoon/casket1.kch#opts=1#bnum=150000000#msiz=2g#dfunit=8
(ulog
和数据库文件casket1.kch 都需要指定目录,否则将在当前目录生成,目录需要事先创建好。)

再创建一个从库实例
ktserver
-dmn -host 192.168.2.80 -port 1978 -ulog /data/tycoon/0001-ulog -sid 2 -mhost
192.168.2.70 -mport 1978 -rts /data/tycoon/001.rts

/data/tycoon/casket1.kch#opts=1#bnum=150000000#msiz=1g#dfunit=8

测试

向主库中添加数据
curl
"http://192.168.2.70:1978/rpc/set?key=japan&value=tokyo"
读取主库
curl
"http://192.168.2.70:1978/japan"
Tokyo
读取从库
curl
"http://192.168.2.80:1978/japan"
tokyo
删除主库数据
curl -X DELETE
"http://192.168.2.70:1978/japan"
再次读取从库
curl
"http://192.168.2.80:1978/japan"
没有数据了。成功。

五. 双主模式的配置
Kyoto
Tycoon 支持双主模式以提高高可用。
例:创建两个主库实例,分别叫A 和B。
首先创建A
ktserver -dmn -host
192.168.2.70 -port 1978 -ulog /data/tycoon/0001-ulog -sid 1  -mhost
192.168.2.80 -mport 1978 -rts /data/tycoon/001.rts 
/data/tycoon/casket1.kch#opts=1#bnum=150000000#msiz=11g#dfunit=8

然后创建B

ktserver -dmn -host 192.168.2.80 -port 1978 -ulog /data/tycoon/0001-ulog
-sid 2  -mhost 192.168.2.70 -mport 1978 -rts /data/tycoon/001.rts 
/data/tycoon/casket1.kch#opts=1#bnum=150000000#msiz=11g#dfunit=8

添加数据
向A 中添加数据
curl
"http://192.168.2.70:1978/rpc/set?key=one&value=first"
curl
"http://192.168.2.70:1978/rpc/set?key=two&value=second"
向B 中添加数据

curl "http://192.168.2.80:1978/rpc/set?key=three&value=third"
curl
"http://192.168.2.80:1978/rpc/set?key=four&value=fourth"

添加数据也可以使用ktremotemgr 实用程序
ktremotemgr set -host 192.168.2.70 -port 1978
one first
ktremotemgr set -host 192.168.2.70 -port 1978 two second

ktremotemgr set -host 192.168.2.80 -port 1978 three third
ktremotemgr
set -host 192.168.2.80 -port 1978 four fourth
查看数据
$ ktremotemgr list
-host 192.168.2.70 -port 1978 -pv
one first
two second
three third

four fourth
$ ktremotemgr list -host 192.168.2.80 -port 1978 -pv
one
first
two second
three third
four fourth

六.并发访问测试和远程访问速度测试
1.并发访问测试。

并发测试工具使用webbench,最多可以模拟3万个并发连接去测试网站的负载能力,个人感觉要比Apache自带的ab压力测试工具好,安装使用也特别方便。具体安装参见:

http://blog.s135.com/post/288/

http://home.tiscali.cz/cz210552/webbench.html
测试流程:

如下,由于一个节点模拟三万并发会造成客户端僵死,所以先使用一台客户端模拟1万个并发去测试一个kt节点,发现kt节点无任何错误和异常。

[root@xoyo-test-43]#webbench -c 10000 -t 10
http://192.168.2.70:1978/rpc/get?key=00000001
Webbench - Simple Web
Benchmark 1.5
Copyright (c) Radim Kolar 1997-2004, GPL Open Source Software.

Benchmarking: GET http://192.168.2.70:1978/rpc/get?key=00000001

10000 clients, running 10 sec.

Speed=1117350 pages/min, 3538104
bytes/sec.
Requests: 186225 susceed, 0 failed.

然后使用四台客户端每台模拟一万个并发去测试一个kt节点,发现kt节点扔无错误,但kt节点进程占用资源开始飙高。

得出结论,一个kt节点可应对四万以上并发连接。

2.网络远程访问速度测试

使用kt自带的ktremotetest进程远程读写测试:
[root@xoyo-45 tycoon]# ktremotetest  bulk  
-set -host 192.168.2.70 -port 1978 100000
opening the database:
time:
0.000
memory: 208896
time: 19.875
closing the database:
time:
0.000
ok
[root@xoyo-45 tycoon]# ktremotetest  bulk   -get -host
192.168.2.70 -port 1978 100000
opening the database:
time: 0.000

memory: 208896
time: 17.707
closing the database:
time: 0.000

ok
经多次测试,得出结论,同局域网断其他主机访问kt节点读写都为每秒5000条记录左右。本机访问,每秒为1万条左右。

附录一kstserver启动参数
-host name : 指定需要绑定的服务器域名或IP 地址。默认绑定这台服务器上的所有IP

地址。
-port num : 指定需要绑定的端口号。默认端口号为1978
-tout num :
指定每个会话的超时时间(单位为秒)。默认永不超时。
-th num : 指定线程数。默认为8 个线程。
-log file:
输出日志信息到指定文件(这里指定文件名)。
-li : 日志记录级别---notice。
-ls : 日志记录级别---system。

-le : 日志记录级别---error。
-lz : 不记录日志.
-ulog dir :
指定同步日志文件存放路径(这里指定目录名)。
-ulim num : 指定每个同步日志文件的大小(例如128m)。
-uasi num :
指定数据同步到磁盘的时间间隔,该选项默认是关闭的。
-sid num : 指定服务器ID 号(当使用主辅模式时,每台ktserver 需要不同的ID
号)
-ord : opens the database as a reader.
-oat : opens the database with
the auto transaction option.
-oas : opens the database with the auto
synchronization option.
-onl : opens the database with the no locking
option.
-otl : opens the database with the try locking option.
-onr :
opens the database with the no auto repair option.
-asi num : 指定自动同步间隔,默认关闭。

-ash : 当自动同步的时候也同步到物理磁盘上
-bgs dir : specifies the path of the background
snapshot directory. By default, it is disabled.
-bgsi num : specifies the
interval of background snapshotting. By default, it is 180.
-bgsc str :
指定快照的压缩格式。支持的格式有"zlib","lzo",lzma"
-dmn : 以守护进程方式运行。
-pid file: 输出进程ID
到指定文件(这里指定文件名)。
-cmd dir : 指定外部指令的搜寻路径,默认是当前路径。
-scr file : 指定脚本文件

-mhost str: 指定主辅同步模式下,主服务器的域名或IP 地址。
-mport num : 指定主辅同步模式下,主服务器的端口号。

-rts file: 指定用来存放同步时间戳的文件名。
-riv num : 指定每次同步操作的毫秒时间间隔,默认是0.04 毫秒。

-plsv file : specifies the shared library file of a pluggable server.

-plex str : specifies the configuration expression of a pluggable server.

-pldb file : 指定插件库的动态链接库文件。

附录二常用ktremotemgr参数

1.打印当前数据库状态信息
ktremotemgr report [-host str] [-port num] [-tout num]

2.插入数据
ktremotemgr set [-host str] [-port num] [-tout num] [-db str]
[-add|-rep|-app|-inci|-incd] [-sx]
[-xt num] key value
3.删除数据

ktremotemgr remove [-host str] [-port num] [-tout num] [-db str] [-sx] key

4.查询数据
ktremotemgr get [-host str] [-port num] [-tout num] [-db str]
[-sx] [-px] [-pt] [-pz] key
5.列出所有key
ktremotemgr list [-host str]
[-port num] [-tout num] [-db str] [-des] [-max num] [-sx] [-pv]
[-px] [-pt]
[key]
6.根据key 删除多条记录
ktremotemgr removebulk [-host str] [-port num]
[-tout num] [-bin] [-db str] [-sx] key1 key2
key3 ...
7.根据key 取出多条记录

ktremotemgr getbulk [-host str] [-port num] [-tout num] [-bin] [-db str]
[-sx] [-px] key1 key2
key3 ...
8.批量添加key、value
ktremotemgr setbulk
[-host str] [-port num] [-tout num] [-bin] [-db str] [-sx] [-xt num] key

value ...
9.模拟一个客户端复制并打印更新记录
ktremotemgr slave [-host str] [-port
num] [-tout num] [-ts num] [-sid num] [-ux] [-uw] [-uf]
[-ur]

10.删除数据库中的所有记录
ktremotemgr clear [-host str] [-port num] [-tout num]
[-db str]
11.设定复制配置
ktremotemgr tunerepl [-host str] [-port num] [-tout
num] [-mport str] [-ts num] [-iv num]
[mhost]
选项说明
-host str:
指定主机名或IP
-port num: 指定端口号
-tout num: 指定超时时间.
-bin: 使用二进制协议.

-mport num: 指定主库端口号.
-ts num: 指定已经读取日志的最大时间戳。“now”意为当前时间戳。
-iv num:
指定每次同步操作的毫秒时间间隔。
-db str: 指定数据库名称
-st: 打印详细信息。
-hard: 启动设备的物理同步

-cmd str: specifies an outer command for postprocessing.
-add: 运行添加操作

-app: 追加操作
-rep: 替代操作
-inci: 使整数自增
-incd: 使实数自增
-sx:
将输入数据转换成16进制字符串
-xt num: 指定截止时间
-px: 将输出数据转换成16进制字符串
-pt: 打印截止时间

-pz: does not append line feed at the end of the output.
-des: visits
records in descending order.
-max num: specifies the maximum number of shown
records.
-pv: 打印value 值.
-step num: 指定步骤的数字.
-sid num: 指定server ID .

-ux: fetches update logs of the specified server ID number only.
-uw:
等待更新.
-uf: 打印每次更新日志的状态.
-ur:移除老的更新日志文件.

附录三安装遇到的错误及使用中可能遇到的问题

1.kc和kt都不使用最新版本,因为最新版本似乎存在环境依赖的bug,编译N多错误,很难通过。
2.安装中可能遇到以下错误

[root@xoyo-test-43 kyototycoon-0.9.35]# ./configure
checking Kyoto
Cabinet by pkg-config... no
configure: error: required version of Kyoto
Cabinet was not detected
原因:版本不匹配
我测试匹配的版本如下

kyotocabinet-1.2.43.tar.gz
kyototycoon-0.9.33.tar.gz

注意事项:如果安装kyotocabinet 使用--prefix 参数指定安装目录了,再安装kyototycoon 时

就需要加参数--with-kc
例如:
[root@test kyototycoon-0.9.33]# ./configure
--with-kc=/usr/local/webserver/kyotocabinet/

3.生成数据时,是一个非常耗费内存的过程,如果灌入上亿条记录,需要12G内存以上为好,不然会非常慢,甚至可能需要耗费几天的时间。而且,按目前的观察,即使现在某一台生成kch数据,再拷贝到其他节点,再启动kt进程的时候似乎还要重新加载一次数据,这个过程也是非常慢的。