分布式存储发展至今,市场上并没有一个能够被广泛接受并引用的定义。
分布式存储系统是将数据分散存储在多*立的设备上。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
首先:分布式存储系统是将数据分散存储在多*立的设备上,这里的“多*立的设备”,不要理解成为磁盘或者 SSD,可以理解为 x86 通用服务器、Power 服务器等,也可以理解为专门设计和优化的专用存储设备。
其中,以 x86 通用服务器最为普遍。为了帮助用户理解分布式存储,百易存储研究院建议用“存储节点”来代替“多*立的设备”,这里的存储节点,可以是 x86 服务器(或者称为存储服务器、服务器存储)、Power服务器,也可以是专用存储设备,甚至使用传统阵列,其中,最为普遍的还是 x86 通用服务器,其市场较为成熟,非常容易获得,产品性价比非常具有竞争力。
其次,“传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈”的表述中,网络存储系统的表述多用于与直连存储(DAS)的区分,主要突出其能够通过网络被多个应用系统共享,网络存储系统又可以划分为:存储区域网络(SAN)和网络连接存储(NAS),是 SAN、NAS 两种存储系统的统称。
这里所说的“存储服务器”主要指的是阵列控制器(也称为机头)+ 盘阵的设计方式,以往多采用专用集成电路芯片(ASIC)设计控制器,经历了双控到多控的变化,控制器与控制器之间采用专用网络连接,控制器与磁盘之间通过专用后端网络连接,从而实现了连接的全冗余架构设计,具有非常高的可靠性和稳定性。也因为如此,系统成本居高不下。
在系统的扩展性上,可以通过盘阵中盘的数量进行调节,系统具有一定的弹性,所谓 Scale Up,也就是纵向扩展,但受制于机头的性能,整个系统仍然存在性能天花板,用户只能够借助入门级存储、中端存储、高端存储的升级来解决问题。根据以上的判断和理解,百易存储研究院认为用传统存储、传统阵列或者传统磁盘阵列的表述更为便于理解。
最后,“分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展”的表述中,分布式网络存储系统就是我们要说的分布式存储;可扩展的系统架构更多是指可以通过增加或者删减存储节点所带来的横向扩展(Scale Out)的架构,存储系统的性能可以随着节点的增加或者减少呈现动态变化的特征。这里提到的“位置服务器更好地理解应该是分布式存储中的全局统一命名空间的元数据管理的部分。
通过上述分析,百易存储研究院认为有关分布式存储的定义应该关注几个重要的特征:一是横向扩展,一通过网络连接的存储节点,以及软件统一调度管理全局统一命名空间的存储资源池,这应该符合分布式存储的发展规律。仅仅强调软件定义,或者x86 通用服务器;强调云的弹性管理的特点,都不能够完全准确的描述分布式存储系统,也很难取得市场的广泛共识。根据以上的判断和理解,百易存储研究院认为用传统存储、传统阵列或者传统磁盘阵列的表述更为便于理解。
最后,“分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展”的表述中,分布式网络存储系统就是我们要说的分布式存储;可扩展的系统架构更多是指可以通过增加或者删减存储节点所带来的横向扩展(Scale Out)的架构,存储系统的性能可以随着节点的增加或者减少呈现动态变化的特征。这里提到的“位置服务器更好地理解应该是分布式存储中的全局统一命名空间的元数据管理的部分。
传统存储按照功能可以分为 SAN 和 NAS,分别用于块数据、文件数据的存储支持。随着技术的不断发展和用户需求的变化,也出现了统一存储和融合存储的需求,在存储系统的设计上,也出现了软件、硬件分离的设计需求。
对于新分布式存储系统而言,最初设计需求就是替代传统 SAN 存储,并用 ServerSAN 以示区分。但是相比于传统存储的全冗余连接设计,分布式存储系统中的存储节点可靠性相对不高,为此,分布式存储系统通过多副本、纠删码的方式来提升系统的可靠性,为了提升这个存储系统的性能,分布式存储系统需要存储节点配备 SSD,充分利用 SSD 高 IO 的特性。
与此同时,分布式存储横向扩展的特性,非常适用于海量数据存储,特别是非结构化的文件系统。一个分布式存储系统往往同时满足块、文件、对象、大数据,以及 CIFS、NFS 等的数据访问需求。因此,分布式存储很难按照 SAN、NAS、对象进行分类。
对于分布式存储系统,根据是否对外提供应用计算能力,区分为分布式存储和超融合。对于超融合系统而言,最主要的技术突破就体现在存储上,也因为如此,才会把超融合纳入到分布式存储的分类中。
在超融合的产品形态上,最初是以一体机的形态呈现,但随着市场的发展,超融合也提供纯存储的形态,支持将超融合一体机作为单一存储系统的场景。
分布式存储、超融合也是相互渗透、融合发展的,并没有严格意义上的形态区分,这一点应该引起大家的重视。