关于这个概念,应该在上学的时候,老师应该是讲过的,我有大概的印象,记得当时的印象就是:分布式系统--就是原本需要一个人干的事,现在分给n个人干,各自干各自的,最终取得和一个人干的效果一样。
那么,为啥原来一个人干的事,现在却需要n个人来干呢?
先看2个概念性术语吧。。。。。
、、、集中式系统、、、分布式系统
一个人干----------集中式系统
就像我们学Java web的,可以在自己的电脑上跑一个Java web系统,有web页面,有自己的服务层,有自己的数据库。这个和我们实际生活中使用的大型网站是差不多的一个姿势(暂不考虑高级的优化部分:单从实现原理上来讲)。
我们自己电脑上跑的这个系统。就算是一个集中式系统。
在以前,就是这么干的,花大价钱,买个很贵的服务器,然后把所有东西都装到一个机器上,就OK啦。
但是,由于采用单机部署。很可能带来系统大而复杂、难于维护、发生单点故障(单个点发生故障的时候会波及到整个系统或者网络,从而导致整个系统或者网络的瘫痪)、扩展性差等问题。
想想我们大学选课时候的场景,是不是点坏了鼠标,也挤不进去啊。
这就是集中式系统的问题。
要想性能提升,只能买个内存再大点的,处理器更厉害点的。但是,这个代价太大,今年刚买的机器,还没用呢,就给淘汰了。太浪费啦。
这是第一个问题。
还有个问题,这台机器挂了,整个系统就挂啦。
这是第二个问题。
当然,还有很多问题,我也不一一列举啦,我也列举不出来啊。。
n个人干----------分布式系统
我们在实际商业应用中,用的就是分布式,所谓分布式,也就是一件事分给n个人干,大家一起合作,完成任务。在Java web中就是,web服务,数据库服务,service服务,缓存服务,等都是一个个服务器,而且,同一类还是由多个服务器共同组成。
一个坏了,还有顶着呢。
简单来说就是一群独立计算机集合共同对外提供服务,但是对于系统的用户来说,就像是一台计算机在提供服务一样。
分布式意味着可以采用更多的普通计算机(相对于昂贵的大型机)组成分布式集群对外提供服务。
计算机越多,CPU、内存、存储资源等也就越多,能够处理的并发访问量也就越大。
从分布式系统的概念中我们知道,各个主机之间通信和协调主要通过网络进行,所以,
分布式系统中的计算机在空间上几乎没有任何限制,这些计算机可能被放在不同的机柜上,
也可能被部署在不同的机房中,还可能在不同的城市中,对于大型的网站甚至可能分布在不同的国家和地区。
下面的湿胸复制一下:
但是,无论空间上如何分布,一个标准的分布式系统应该具有以下几个主要特征:
分布性
分布式系统中的多台计算机之间在空间位置上可以随意分布,系统中的多台计算机之间没有主、从之分,即没有控制整个系统的主机,也没有受控的从机。
透明性
系统资源被所有计算机共享。每台计算机的用户不仅可以使用本机的资源,还可以使用本分布式系统中其他计算机的资源(包括CPU、文件、打印机等)。
同一性
系统中的若干台计算机可以互相协作来完成一个共同的任务,或者说一个程序可以分布在几台计算机上并行地运行。
通信性
系统中任意两台计算机都可以通过通信来交换信息。
和集中式系统相比,分布式系统的性价比更高、处理能力更强、可靠性更高、也有很好的扩展性。但是,分布式在解决了网站的高并发问题的同时也带来了一些其他问题。首先,分布式的必要条件就是网络,这可能对性能甚至服务能力造成一定的影响。其次,一个集群中的服务器数量越多,服务器宕机的概率也就越大。另外,由于服务在集群中分布是部署,用户的请求只会落到其中一台机器上,所以,一旦处理不好就很容易产生数据一致性问题。
三、常用的分布式方案
分布式应用和服务
将应用和服务进行分层和分割,然后将应用和服务模块进行分布式部署。这样做不仅可以提高并发访问能力、减少数据库连接和资源消耗,还能使不同应用复用共同的服务,使业务易于扩展。
分布式静态资源
对网站的静态资源如JS、CSS、图片等资源进行分布式部署可以减轻应用服务器的负载压力,提高访问速度。
分布式数据和存储
大型网站常常需要处理海量数据,单台计算机往往无法提供足够的内存空间,可以对这些数据进行分布式存储。
分布式计算
随着计算技术的发展,有些应用需要非常巨大的计算能力才能完成,如果采用集中式计算,需要耗费相当长的时间来完成。分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。
四、分布式与集群
分布式(distributed)是指在多台不同的服务器中部署不同的服务模块,通过远程调用协同工作,对外提供服务。
集群(cluster)是指在多台不同的服务器中部署相同应用或服务模块,构成一个集群,通过负载均衡设备对外提供服务。