理解ZooKeeper中的ZNodes
翻译自:http://zookeeper.apache.org/doc/r3.1.2/zookeeperProgrammers.html
ZooKeeper中的每个结点都是一个ZNode。ZNode维护一个包括数据和ACL修改的版本号的stat结构。ZNode结构还包括时间戳。版本号和时间戳一起用来验证缓存和协调更新。ZNode中的数据每更新一次,版本号就相应的增加一次。例如,每当客户端需要检索数据的时候,它也会收到一个数据的版本号。当客户端执行修改或者删除操作时,必须提供正在修改的数据的版本号。如果客户端提供的版本号和实际数据的版本号不匹配的话,更改就会失败。
注意:在分布式应用项目中,node可以指的是一台主机、服务器、总体的一员、一个服务进程等。在ZooKeeper中,node是指数据结点。Servers是指组成组成ZooKeeper服务的机器;quorum peers是指ensemble的服务器;客户端
是指使用ZooKeeper服务的客户端或者进程。
Znodes是程序员操作的主要实体。它有以下几个特性:
Watches(观察者)
客户端可以在ZNode上设置观察者(watches)。所有对ZNode的修改都将触发观察者,之后再清除观察者。当一个
观察者被触发,ZooKeeper就会发送一个通知给客户端。
Data Access
数据被原子性的保存在命名空间的每一个ZNode中。Read可以获得与ZNode相关联的数据,write用来修改数据。每个结点都有一个ACL(Access Control List)来限制谁可以进行这些操作。ZooKeeper不是用来当作普通数据库也不适合用来存储大数据。相反,它是用来管理协同数据。这些数据可能是配置、状态信息或者集合地点等。这些数据都有一个共同的特点,就是他们一般都很小:几千个字节的量级。ZooKeeper的客户端和服务器可以很智能的判别ZNode有小于1M的数据,但是数据一般上都比1M小的多。操作相对大一点的数据将会花费更多的时间,这些额外的时间用来把更多的数据从网络中保存在存储介质中才对。如果需要存储这样的大数据,通常都把它们存储在大容量存储系统中,比如NFS和HDFS,然后在ZooKeeper中保存它们的
存储位置指针。
Ephemeral Nodes(临时结点)
ZooKeeper也有临时结点的概念。这些结点在ZNode被创建的时候存在,当回话结束时,结点就会被删除。因为这样的
临时结点不允许有子结点。
序列结点——唯一命名
当创建一个ZNode,ZooKeeper还可以请求附加一个递增计数器到最后的路径。这个计数器对于父节点来说是唯一的。计数器的格式是%010d——这是一个十位数,前面用0来填充,(计数器之所以有这样的格式是为了便于排序)例如<path>0000000001。注意:计数器用来存储下一个序列号码是一个有符号整数(4字节)由父节点维护,当超出
2147483647时计数器将溢出。
总结
ZooKeeper的节点是通过像树一样的结构来进行维护的,并且每一个节点通过路径来标示以及访问。除此之外,每一个节点还拥有自身的一些信息,包括:数据、数据长度、创建时间、修改时间等等。Znode维护着数据、ACL(access control list,访问控制列表)、时间戳等交换版本号等数据结构,它通过对这些数据的管理来让缓存生效并且令协调更新。每当Znode中的数据更新后它所维护的版本号将增加。另外Znode还具有原子性操作的特点:命名空间中,每一个Znode的数据将被原子地读写。读操作将读取与Znode相关的所有数据,写操作将替换掉所有的数据。除此之外,每一个节点都有一个访问控制列表,这个访问控制列表规定了用户操作的权限。ZooKeeper中同样存在临时节点。这些节点与session同时存在,当session生命周期结束,这些临时节点也将被删除。临时节点在某些场合也发挥着非常重要的作用。