8.1.Zookeeper概念简介

时间:2022-11-10 22:20:32

1.分布式系统概述

理解1:

分布式系统:分布式系统是针对一个大系统而言,将一个大系统分成多个子系统,即多个工程系统。

我们先看下传统的系统模式:

8.1.Zookeeper概念简介  8.1.Zookeeper概念简介

  传统的系统模式将多个功能模块全部在一个工程中写完,模块之间耦合度太高,其中一个升级其他都得升级,把系统按照模块拆分成多个子系统。即在项目中建

立多个工程,把模块拆分,使用接口通信,降低模块之间的耦合度。可以灵活的进行分布式部署。

理解2:

  8.1.Zookeeper概念简介

  图中有三台机器,每台机器各跑一个应用程序。然后我们将这三台机器通过网络将其连接起来,构成一个系统来为用户提供服务,对用户来说这个系统

的架构是透明的,他感觉不到我这个系统是一个什么样的架构。那么我们就可以把这种系统称作一个分布式系统

  分布式应用可以在给定时间(同时)在网络中的多个系统上运行,通过协调它们以快速有效的方式完成特定任务。通常来说,对于复杂而耗时的任务,

非分布式应用(运行在单个系统中)需要几个小时才能完成,而分布式应用通过使用所有系统涉及的计算能力可以在几分钟内完成。

  通过将分布式应用配置为在更多系统上运行,可以进一步减少完成任务的时间。分布式应用正在运行的一组系统称为集群,而在集群中运行的每台机器

被称为节点。分布式应用有两部分, Server(服务器)  Client(客户端) 应用程序。服务器应用程序实际上是分布式的,并具有通用接口,以便客户端

可以连接到集群中的任何服务器并获得相同的结果。 客户端应用程序是与分布式应用进行交互的工具。

2.分布式协调技术  

  分布式协调技术主要用来解决分布式环境当中多个进程之间的同步控制,让他们有序的去访问某种临界资源,防止造成"脏数据"的后果。

  在分布式系统中如何对进程进行调度,假设在第一台机器上挂载了一个资源,然后这三个物理分布的进程都要竞争这个资源,但我们又不希望他们同时

进行访问,这时候我们就需要一个协调器,来让他们有序的来访问这个资源。这个协调器就是我们经常提到,比如说"进程-1"在使用该资源的时候,会先去

获得锁,"进程1"获得锁以后会对该资源保持独占,这样其他进程就无法访问该资源,"进程1"用完该资源以后就将锁释放掉,让其他进程来获得锁,那么通过这

锁机制,我们就能保证了分布式系统中多个进程能够有序的访问该临界资源。那么我们把这个分布式环境下的这个锁叫作分布式锁。这个分布式锁也就是我们

分布式协调技术实现的核心内容,那么如何实现这个分布式呢?

2.1 分布式锁的实现者 

  分布式协调技术方面做得比较好的就是Apache的ZooKeeper,他是分布式锁的实现者之一

3.ZooKeeper概述 

  Apache Zookeeper是一个分布式协调服务;就是为用户的分布式应用程序提供协调服务,并通过稳健的同步技术维护共享数据

  Zookeeper 是一个分布式协调服务的开源框架。主要用来解决分布式集群中应用系统的一致性问题,例如怎样避免同时操作同一数据造成脏读的问题。

  ZooKeeper 本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而

用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。诸如:统一命名服务、分布式配置管理、分

布式消息队列、分布式锁、分布式协调等功能

    A、zookeeper是为别的分布式程序服务的

    B、Zookeeper本身就是一个分布式程序(只要有半数以上节点存活,zk就能正常服务)

    C、Zookeeper所提供的服务涵盖:主从协调、服务器节点动态上下线、统一配置管理、分布式共享锁、统一名称服务……

    D、虽然说可以提供各种服务,但是zookeeper在底层其实只提供了两个功能:

      管理(存储,读取)用户程序提交的数据;

       并为用户程序提供数据节点监听服务;

 整个集群中各个节点的角色是不相同的,各自有各自的职责,但是必须相互协作起来完成整个功能。

4.ZooKeeper特性

  1. 全局数据一致:每个 server 保存一份相同的数据副本,client 无论连接到哪个 server,展示的数据都是一致的,这是最重要的特征;

  2. 可靠性:如果消息(增删改查)被其中一台服务器接受,那么将被所有的服务器接受

  3. 顺序性:包括全局有序和偏序两种:全局有序是指如果在一台服务器上消息 a 在消息 b 前发布,则在所有 Server 上消息 a 都将在消

息 b 前被发布;偏序是指如果一个消息 b 在消息 a 后被同一个发送者发布,a 必将排在 b 前面。

  4. 数据更新原子性:一次数据更新要么成功(半数以上节点成功),要么失败,不存在中间状态;

  5. 实时性:Zookeeper 保证客户端将在一个时间间隔范围内获得服务器的更新信息,或者服务器失效的信息。

5.ZooKeeper 集群角色(status)

  8.1.Zookeeper概念简介

  Leader:Zookeeper 集群工作的核心,事务请求(写操作)的唯一调度和处理者,保证集群事务处理的顺序性;集群内部各个服务

器的调度者。Observer可以接受客户端连接,对于 create,setData,delete 等有写操作的请求转发给leader处理,leader 需要决定编号、

执行操作,这个过程称为一个事务。

  Follower:处理客户端非事务(读操作)请求,并向客户端返回结果,转发事务请求给 Leader;参与集群 Leader 选举投票,此外,

针对访问量比较大的 zookeeper 集群,还可新增观察者角色

  Observer:观察者角色,观察 Zookeeper 集群的最新状态变化并将这些状态同步过来,其对于非事务请求可以进行独立处理,对于

事务请求,则会转发给 Leader服务器进行处理。区别:不会参与任何形式的投票只提供非事务服务,通常用于在不影响集群事务处理能力

的前提下提升集群的非事务处理能力