python模块之bsddb: bdb高性能嵌入式数据库 1.基础知识

时间:2022-09-21 22:56:49
    bsddb模块是用来操作bdb的模块,bdb是著名的Berkeley DB,它的性能非常好,mysql的存储后端引擎都支持bdb的方式。这里简单介绍一些关于bsddb的使用方法。

    bdb不同于一般的关系数据库,它存储的数据只能是以key和value组成的一对数据,使用就像python的字典一样,它不能直接表示多个字段,当要存储多个字段的数据时,只能把数据作为一个整体存放到value中。
使用bsddb面临的第一问题是使用什么数据访问方法,bdb支持四种:btree, hash, queue, recno。这里先说说它们有什么区别,btree是用的树结构来才存储的数据,查询速度很快,可以存储任意复杂的key和value。hash是用的hash算法,速度其实和btree比差不多的,但是当数据量特别巨大时,应该使用hash。queue是队列操作,它有一个限制,它只能存储定长的数据,也就是说value的长度是固定的!但是queue可以保持数据的先进先出,并且对数据的插入做了特殊的优化,并且提供行级锁。queue的key必须是数字。recno和queue类似,但是它可以支持变长的value,它的key同样也是数字。

    这里先对这四种数据访问方法分别做打开数据库,简单插入一条数据的演示。
对于python的bsddb模块来说,打开数据库的操作有两种方式,一是使用原始的接口,就是先打开一个环境,然后从这个环境中打开一个数据库,就像下面:

python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识import bsddb
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识dbenv 
= bsddb.db.DBEnv()
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识dbenv.open(home, bsddb.db.DB_CREATE 
| bsddb.db.DB_INIT_MPOOL)
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
= bsddb.db.DB(dbenv)
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识d.open(filename, bsddb.db.DB_BTREE, bsddb.db.DB_CREATE, 
0666)


还有一种方式是python特有的,这个是bsddb模块本身对上面的过程做了包装,比如打开btree的:

python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识import bsddb
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识db 
= bsddb.btopen('test.db''c')


看起来比上面的简单多了吧。但这种方式提供的接口很有限,也只有很简单的功能,没有第一种的灵活,但是它在python2.5的版本里是线程安全的。这里都介绍一下。
看看一个例子:
 
#-*- encoding: gb2312 -*-
import os, sys, string
import bsddb, time

home 
= "db_home"
filename 
= "test.db"
try:
    
# 创建home目录
    os.mkdir(home)
except:
    
pass

# 创建数据库环境
dbenv = bsddb.db.DBEnv()
# 打开数据库环境
dbenv.open(home, bsddb.db.DB_CREATE | bsddb.db.DB_INIT_MPOOL)
# 创建数据库对象
= bsddb.db.DB(dbenv)
# 打开数据库, 这里的第二个参数就是指定使用什么数据访问方法
#
 btree是 bsddb.db.DB_BTREE, hash是bsddb.db.DB_HASH
#
 queu 是 bsddb.db.DB_QUEUE,  recno 是bsddb.db.DB_RECNO
d.open(filename, bsddb.db.DB_BTREE, bsddb.db.DB_CREATE, 0666)
# 插入一条数据,注意queue和recno的key不能是字符串的,应该是数字
d.put('test1''zhaowei')    
print d.items()
# 关闭,这时会把数据写回文件
d.close()
dbenv.close()

下面来个使用queue的,注意看有什么区别:

python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识#-*- encoding: gb2312 -*-
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
import os, sys, string
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
import bsddb, time
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识home 
= "db_home"
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识filename 
= "testqueue.db"
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
try:
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识    os.mkdir(home)
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
except:
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识    
pass
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识dbenv 
= bsddb.db.DBEnv()
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识dbenv.open(home, bsddb.db.DB_CREATE 
| bsddb.db.DB_INIT_MPOOL)
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
= bsddb.db.DB(dbenv)
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
# queue必须要设置一个value的长度,它的value是定长的
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
d.set_re_len(40)
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识d.open(filename, bsddb.db.DB_QUEUE, bsddb.db.DB_CREATE, 
0666)
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
# 它的key必须是数字
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
d.put(1'zhaowei')
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
print d.items()
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识d.close()
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识dbenv.close()

那简单的第二种方式使用如下, 要简洁很多了:

python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识import bsddb
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
= bsddb.hashopen("aaa.db""c")
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识d[
'test1'= "zhaowei"
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识
print d.items()
python模块之bsddb:  bdb高性能嵌入式数据库  1.基础知识d.close()