【Apache ZooKeeper】了解ZooKeeper中的ZNodes

2013-09-14

【Apache ZooKeeper】理解ZooKeeper中的ZNodes理解ZooKeeper中的ZNodes翻译自：http://zookeeper.apache.org/

【Apache ZooKeeper】理解ZooKeeper中的ZNodes

理解ZooKeeper中的ZNodes

翻译自：http://zookeeper.apache.org/doc/r3.1.2/zookeeperProgrammers.html

ZooKeeper中的每个结点都是一个ZNode。ZNode维护一个包括数据和ACL修改的版本号的stat结构。ZNode结构还包括时间戳。版本号和时间戳一起用来验证缓存和协调更新。ZNode中的数据每更新一次，版本号就相应的增加一次。例如，每当客户端需要检索数据的时候，它也会收到一个数据的版本号。当客户端执行修改或者删除操作时，必须提供正在修改的数据的版本号。如果客户端提供的版本号和实际数据的版本号不匹配的话，更改就会失败。
注意：在分布式应用项目中，node可以指的是一台主机、服务器、总体的一员、一个服务进程等。在ZooKeeper中，node是指数据结点。Servers是指组成组成ZooKeeper服务的机器；quorum peers是指ensemble的服务器；客户端是指使用ZooKeeper服务的客户端或者进程。

Znodes是程序员操作的主要实体。它有以下几个特性：

Watches（观察者）
客户端可以在ZNode上设置观察者（watches）。所有对ZNode的修改都将触发观察者，之后再清除观察者。当一个观察者被触发，ZooKeeper就会发送一个通知给客户端。

Data Access
数据被原子性的保存在命名空间的每一个ZNode中。Read可以获得与ZNode相关联的数据，write用来修改数据。每个结点都有一个ACL(Access Control List)来限制谁可以进行这些操作。ZooKeeper不是用来当作普通数据库也不适合用来存储大数据。相反，它是用来管理协同数据。这些数据可能是配置、状态信息或者集合地点等。这些数据都有一个共同的特点，就是他们一般都很小：几千个字节的量级。ZooKeeper的客户端和服务器可以很智能的判别ZNode有小于1M的数据，但是数据一般上都比1M小的多。操作相对大一点的数据将会花费更多的时间，这些额外的时间用来把更多的数据从网络中保存在存储介质中才对。如果需要存储这样的大数据，通常都把它们存储在大容量存储系统中，比如NFS和HDFS，然后在ZooKeeper中保存它们的存储位置指针。

Ephemeral Nodes（临时结点）
ZooKeeper也有临时结点的概念。这些结点在ZNode被创建的时候存在，当回话结束时，结点就会被删除。因为这样的临时结点不允许有子结点。

序列结点——唯一命名
当创建一个ZNode，ZooKeeper还可以请求附加一个递增计数器到最后的路径。这个计数器对于父节点来说是唯一的。计数器的格式是%010d——这是一个十位数，前面用0来填充，（计数器之所以有这样的格式是为了便于排序）例如<path>0000000001。注意：计数器用来存储下一个序列号码是一个有符号整数(4字节)由父节点维护,当超出2147483647时计数器将溢出。

总结

ZooKeeper的节点是通过像树一样的结构来进行维护的，并且每一个节点通过路径来标示以及访问。除此之外，每一个节点还拥有自身的一些信息，包括：数据、数据长度、创建时间、修改时间等等。Znode维护着数据、ACL（access control list，访问控制列表）、时间戳等交换版本号等数据结构，它通过对这些数据的管理来让缓存生效并且令协调更新。每当Znode中的数据更新后它所维护的版本号将增加。另外Znode还具有原子性操作的特点：命名空间中，每一个Znode的数据将被原子地读写。读操作将读取与Znode相关的所有数据，写操作将替换掉所有的数据。除此之外，每一个节点都有一个访问控制列表，这个访问控制列表规定了用户操作的权限。ZooKeeper中同样存在临时节点。这些节点与session同时存在，当session生命周期结束，这些临时节点也将被删除。临时节点在某些场合也发挥着非常重要的作用。

热点排行