浅谈Redis数据库的键值设计(转)

丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。

下面举一些常见适合kv数据库的例子来谈谈键值的设计，并与关系型数据库做一个对比，发现关系型的不足之处。

用户登录系统

记录用户登录信息的一个系统，我们简化业务后只留下一张表。

关系型数据库的设计

mysql> select * from login;

+---------+----------------+-------------+---------------------+

| user_id | name           | login_times | last_login_time     |

+---------+----------------+-------------+---------------------+

|       1 | ken thompson   |           5 | 2011-01-01 00:00:00 |

|       2 | dennis ritchie |           1 | 2011-02-01 00:00:00 |

|       3 | Joe Armstrong  |           2 | 2011-03-01 00:00:00 |

+---------+----------------+-------------+---------------------+

user_id表的主键，name表示用户名，login_times表示该用户的登录次数，每次用户登录后，login_times会自增，而last_login_time更新为当前时间。

REDIS的设计

关系型数据转化为KV数据库，我的方法如下：

一般使用冒号做分割符，这是不成文的规矩。比如在php-admin for redis系统里，就是默认以冒号分割，于是user:1 user:2等key会分成一组。于是以上的关系数据转化成kv数据后记录如下：

Set login:1:login_times 5

Set login:2:login_times 1

Set login:3:login_times 2

Set login:1:last_login_time 2011-1-1

Set login:2:last_login_time 2011-2-1

Set login:3:last_login_time 2011-3-1

set login:1:name ”ken thompson“

set login:2:name “dennis ritchie”

set login:3:name ”Joe Armstrong“

这样在已知主键的情况下，通过get、set就可以获得或者修改用户的登录次数和最后登录时间和姓名。

一般用户是无法知道自己的id的，只知道自己的用户名，所以还必须有一个从name到id的映射关系，这里的设计与上面的有所不同。

set "login:ken thompson:id"      1

set "login:dennis ritchie:id"    2

set "login: Joe Armstrong:id"    3

这样每次用户登录的时候业务逻辑如下（python版），r是redis对象，name是已经获知的用户名。

#获得用户的id

uid = r.get("login:%s:id" % name)

#自增用户的登录次数

ret = r.incr("login:%s:login_times" % uid)

#更新该用户的最后登录时间

ret = r.set("login:%s:last_login_time" % uid, datetime.datetime.now())

如果需求仅仅是已知id，更新或者获取某个用户的最后登录时间，登录次数，关系型和kv数据库无啥区别。一个通过btree pk，一个通过hash，效果都很好。

假设有如下需求，查找最近登录的N个用户。开发人员看看，还是比较简单的，一个sql搞定。

select * from login order by last_login_time desc limit N

DBA了解需求后，考虑到以后表如果比较大，所以在last_login_time上建个索引。执行计划从索引leafblock 的最右边开始访问N条记录，再回表N次，效果很好。

过了两天，又来一个需求，需要知道登录次数最多的人是谁。同样的关系型如何处理？DEV说简单

select * from login order by login_times desc limit N

DBA一看，又要在login_time上建立一个索引。有没有觉得有点问题呢，表上每个字段上都有素引。

关系型数据库的数据存储的的不灵活是问题的源头，数据仅有一种储存方法，那就是按行排列的堆表。统一的数据结构意味着你必须使用索引来改变sql的访问路径来快速访问某个列的，而访问路径的增加又意味着你必须使用统计信息来辅助，于是一大堆的问题就出现了。

没有索引，没有统计计划，没有执行计划，这就是kv数据库。

redis里如何满足以上的需求呢？对于求最新的N条数据的需求，链表的后进后出的特点非常适合。我们在上面的登录代码之后添加一段代码，维护一个登录的链表，控制他的长度，使得里面永远保存的是最近的N个登录用户。

#把当前登录人添加到链表里

ret = r.lpush("login:last_login_times", uid)

#保持链表只有N位

ret = redis.ltrim("login:last_login_times", 0, N-1)

这样需要获得最新登录人的id，如下的代码即可

last_login_list = r.lrange("login:last_login_times", 0, N-1)

另外，求登录次数最多的人，对于排序，积分榜这类需求，sorted set非常的适合，我们把用户和登录次数统一存储在一个sorted set里。

zadd login:login_times 5 1

zadd login:login_times 1 2

zadd login:login_times 2 3

这样假如某个用户登录，额外维护一个sorted set，代码如此

#对该用户的登录次数自增1

ret = r.zincrby("login:login_times", 1, uid)

那么如何获得登录次数最多的用户呢，逆序排列取的排名第N的用户即可

ret = r.zrevrange("login:login_times", 0, N-1)

可以看出，DEV需要添加2行代码，而DBA不需要考虑索引什么的。

TAG系统

tag在互联网应用里尤其多见，如果以传统的关系型数据库来设计有点不伦不类。我们以查找书的例子来看看redis在这方面的优势。

关系型数据库的设计

两张表，一张book的明细，一张tag表，表示每本的tag，一本书存在多个tag。

mysql> select * from book;

+------+-------------------------------+----------------+

| id   | name                          | author         |

+------+-------------------------------+----------------+

|    1 | The Ruby Programming Language | Mark Pilgrim   |

|    1 | Ruby on rail                  | David Flanagan |

|    1 | Programming Erlang            | Joe Armstrong  |

+------+-------------------------------+----------------+

mysql> select * from tag;

+---------+---------+

| tagname | book_id |

+---------+---------+

| ruby    |       1 |

| ruby    |       2 |

| web     |       2 |

| erlang  |       3 |

+---------+---------+

假如有如此需求，查找即是ruby又是web方面的书籍，如果以关系型数据库会怎么处理？

select b.name, b.author  from tag t1, tag t2, book b

where t1.tagname = 'web' and t2.tagname = 'ruby' and t1.book_id = t2.book_id and b.id = t1.book_id

tag表自关联2次再与book关联，这个sql还是比较复杂的，如果要求即ruby，但不是web方面的书籍呢？

关系型数据其实并不太适合这些集合操作。

REDIS的设计

首先book的数据肯定要存储的，和上面一样。

set book:1:name    ”The Ruby Programming Language”

Set book:2:name     ”Ruby on rail”

Set book:3:name     ”Programming Erlang”

set book:1:author    ”Mark Pilgrim”

Set book:2:author     ”David Flanagan”

Set book:3:author     ”Joe Armstrong”

tag表我们使用集合来存储数据，因为集合擅长求交集、并集

sadd tag:ruby 1

sadd tag:ruby 2

sadd tag:web 2

sadd tag:erlang 3

那么，即属于ruby又属于web的书？

inter_list = redis.sinter("tag.web", "tag:ruby")

即属于ruby，但不属于web的书？

inter_list = redis.sdiff("tag.ruby", "tag:web")

属于ruby和属于web的书的合集？

inter_list = redis.sunion("tag.ruby", "tag:web")

简单到不行阿。

从以上2个例子可以看出在某些场景里，关系型数据库是不太适合的，你可能能够设计出满足需求的系统，但总是感觉的怪怪的，有种生搬硬套的感觉。

尤其登录系统这个例子，频繁的为业务建立索引。放在一个复杂的系统里，ddl（创建索引）有可能改变执行计划。导致其它的sql采用不同的执行计划，业务复杂的老系统，这个问题是很难预估的，sql千奇百怪。要求DBA对这个系统里所有的sql都了解，这点太难了。这个问题在oracle里尤其严重，每个DBA估计都碰到过。对于MySQL这类系统，ddl又不方便（虽然现在有online ddl的方法）。碰到大表，DBA凌晨爬起来在业务低峰期操作，这事我没少干过。而这种需求放到redis里就很好处理，DBA仅仅对容量进行预估即可。

未来的OLTP系统应该是kv和关系型的紧密结合。

浅谈Redis数据库的键值设计(转)的更多相关文章

浅谈REDIS数据库的键值设计（转）
add by zhj: 关系数据库表的一条记录可以映射成Redis中的一个hash类型,其实数据库记录本来就是键值对.这样,要比本文中的键设计用更少的键,更节省内存,因为每个键除了它的键值占用内存外, ...
Python&&num;160&semi;基于python+mysql浅谈redis缓存设计与数据库关联数据处理
基于python+mysql浅谈redis缓存设计与数据库关联数据处理 by:授客 QQ:1033553122 测试环境 redis-3.0.7 CentOS 6.5-x86_64 python 3 ...
&dollar;&period;ajax()方法详解 ajax之async属性【原创】详细案例解剖——浅谈Redis缓存的常用5种方式（String，Hash，List，set，SetSorted ）
$.ajax()方法详解 jquery中的ajax方法参数总是记不住,这里记录一下. 1.url: 要求为String类型的参数,(默认为当前页地址)发送请求的地址. 2.type: 要求为Str ...
浅谈Redis面试热点之工程架构篇[1]
前言前面用两篇文章大致介绍了Redis热点面试中的底层实现相关的问题,感兴趣的可以回顾一下:[决战西二旗]|Redis面试热点之底层实现篇[决战西二旗]|Redis面试热点之底层实现篇(续) 接下来 ...
Redis中的键值过期操作
1.过期设置 Redis 中设置过期时间主要通过以下四种方式: expire key seconds:设置 key 在 n 秒后过期: pexpire key milliseconds:设置 key ...
Redis键值设计(转载）
参考资料:https://blog.csdn.net/iloveyin/article/details/7105181 丰富的数据结构使得redis的设计非常的有趣.不像关系型数据库那样,DEV和DB ...
（转）运维角度浅谈MySQL数据库优化
转自:http://lizhenliang.blog.51cto.com/7876557/1657465 一个成熟的数据库架构并不是一开始设计就具备高可用.高伸缩等特性的,它是随着用户量的增加,基础架 ...
运维角度浅谈MySQL数据库优化(转)
一个成熟的数据库架构并不是一开始设计就具备高可用.高伸缩等特性的,它是随着用户量的增加,基础架构才逐渐完善.这篇博文主要谈MySQL数据库发展周期中所面临的问题及优化方案,暂且抛开前端应用不说,大致分 ...
从运维角度浅谈 MySQL 数据库优化
一个成熟的数据库架构并不是一开始设计就具备高可用.高伸缩等特性的,它是随着用户量的增加,基础架构才逐渐完善.这篇博文主要谈MySQL数据库发展周期中所面临的问题及优化方案,暂且抛开前端应用不说,大致分 ...

随机推荐

NOIP2008双栈排序[二分图染色|栈|DP]
题目描述 Tom最近在研究一个有趣的排序问题.如图所示,通过2个栈S1和S2,Tom希望借助以下4种操作实现将输入序列升序排序. 操作a 如果输入序列不为空,将第一个元素压入栈S1 操作b 如果栈S1 ...
（Python）继承
面向对象的另一个特性是继承,继承可以更好的代码重用. 例如一个学校里面的成员有老师.学生.老师和学生都有共同的属性名字和年纪.但老师还有它自己的属性,如工资.学生也有它的属性,如成绩. 因此我们可以设 ...
安装win8、ubuntu双系统的过程
弄了一个晚上,终于完成了,之前是用虚拟机的,但是觉得不带劲,并且折腾来时菜鸟变大神的捷径,虽然现在还一直在爬坑.继续奋斗吧...王小二首先是看 ubuntu 百度贴吧的安装帖子(http://tie ...
ssis trainning
1. 防止包打开后hang住,可以使用delay validation=false. 2.2008R2 configuration 起作用的优先级? 一是des ign time. 二是运行的时候指定 ...
CSS hack样式兼容模式收藏
part1 —— 浏览器测试仪器,测试您现在使用的浏览器类型 IE6 IE7 IE8 Firefox Opera Safari (Chrome) IE6 IE7 IE8 ...
OperateParticleWithCodes
[OperateParticleWithCodes] Listing 6-6 shows how you might configure an emitter’s scale property. Th ...
Can&&num;39&semi;t connect to MySQL server on localhost (10061)解决方法
出现这种错误的原因是由于MySQL的服务被关闭的原因,重新启动一下服务就可以了,启动服务的操作如下: 右键[计算机]-[管理]
sql2008r2局域网复制订阅实操
10.129.186.37 本机 10.129.186.95 服务器局域网环境复制类型:事务复制注意点:要复制的表,必须有主键,否则不可选复制表. 要点1,局域网尝试用共享的方式保存快照文件夹, ...
RN 的页面布局
从 https://blog.csdn.net/liangzelei/article/details/53965417转载 React Native布局详细指南 https://www.jiansh ...
【Convex Optimization (by Boyd) 学习笔记】Chapter 2 - Convex sets(1) 仿射集&amp&semi;凸集
I. 仿射凸集(Affine and convex sets) 1. 线与线段假设$R^n$空间内两点$x_1,x_2\, (x_1≠x_2)$,那么\(y=\theta x_1+(1-\t ...