大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

时间:2022-10-23 08:51:40

 

NoSQL的三大基石:cap,Base,最终一致性

 

5.4.1 cap理论(帽子理论):
 
consistency:一致性
availability:可用性
partition tolerance:分区容忍性
大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

 

理想的目标是设计一个分布式文件系统,同时实现CAP三个性质,但证明不可能,只能三者取二。

1)牺牲一致性换取可用性的实例:
大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

无法传播的情况发生时,若p2要求马上读副本v2(保证可用性),数据不一致(牺牲一致性);

若p2等到p1把数据传过来再读副本v2(保证一致性),已经过了一段时间(牺牲可用性); 
 

2)面对Cap问题有以下几种选择:
CA(传统数据库:mysql)
CP(HBase)
AP(Cassandra)
大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

 

3)不同产品在CAP理论下的不同设计原则

大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

 

 

 

 

5.4.2 BASE和最终一致性:

全称:Basically Available, Soft state 和 Eventual consistency


关系数据库追求ACID四性;
NoSQL数据库追求BASE特性;
 
 
1)BASE:
大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石
最终一致性:弱一致性的特例
可能有段时间不一致,但最终会达到一致。
 
 
2)最终一致性  可区分为 大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石
大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

 

1.因果一致性:
进程A通知进程B,它更新了一个数据项,B后续访问就可以获得A写入的最新值。但C和D没有被通知,只能最终访问到,但不能马*问到。
2.读己之所写一致性
3..单调读一致性
4.会话一致性
5.单调写一致性
 
 

3)实现各种类型的一致性:
大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

 

大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石

保证强一致性的最小设定:R+W=N+1


对于分布式系统来说,为了保证高可用性,比如HDFS,一般设置 副本数量N>=3
 

(实例)
大数据技术原理与应用【第五讲】NoSQL数据库:5.4 NoSQL的三大基石