简单的理解数据库三范式

时间:2021-03-27 04:25:31

 范式:英文名称是 Normal Form,它是英国人 E.F.Codd(关系数据库的老祖宗)在上个世纪70年代提出关系数据库模型后总结出来的,范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵循的规则和指导方法。目前有迹可寻的共有8种范式,依次是:1NF,2NF,3NF,BCNF,4NF,5NF,DKNF,6NF。通常所用到的只是前三个范式,即:第一范式(1NF),第二范式(2NF),第三范式(3NF)。下面就简单介绍下这三个范式。 

1NF:字段不可分; 

2NF:有主键,非主键字段依赖主键; 
3NF:非主键字段不能相互依赖; 

解释: 
1NF:原子性 字段不可再分,否则就不是关系数据库; 
2NF:唯一性 一个表只说明一个事物; 
3NF:每列都与主键有直接关系,不存在传递依赖; 

不符合第一范式的例子(关系数据库中create不出这样的表): 

表:字段1, 字段2(字段2.1, 字段2.2), 字段3 ...... 

存在的问题: 因为设计不出这样的表, 所以没有问题; 

不符合第二范式的例子: 

表:学号, 姓名, 年龄, 课程名称, 成绩, 学分; 

这个表明显说明了两个事务:学生信息, 课程信息; 

存在问题: 

数据冗余,每条记录都含有相同信息; 
删除异常:删除所有学生成绩,就把课程信息全删除了; 
插入异常:学生未选课,无法记录进数据库; 
更新异常:调整课程学分,所有行都调整。 

修正: 

学生:Student(学号, 姓名, 年龄); 

课程:Course(课程名称, 学分); 

选课关系:SelectCourse(学号, 课程名称, 成绩)。 

满足第2范式只消除了插入异常。 


不符合第三范式的例子: 

学号, 姓名, 年龄, 所在学院, 学院联系电话,关键字为单一关键字"学号"; 

存在依赖传递: (学号) → (所在学院) → (学院地点, 学院电话) 

存在问题: 

数据冗余:有重复值; 

更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况 

删除异常 

修正: 
学生:(学号, 姓名, 年龄, 所在学院); 

学院:(学院, 地点, 电话)。 


依赖:由..决定;依赖主键:由主键决定。

关于如何区分一个范式是违反2NF还是3NF(虽然没什么意义,但是新人都会迷惑):


违反2NF,不满足都依赖主键的原则,如上面例子,学分不是由学号(学生)决定的。由于有属性不依赖主键,所以一般需要分成3(严格说是n+1)个表,2个事物加一个关系。违反2NF必然违反3NF,但是通常说法是违反2NF;


违反3NF(已经满足2NF),即违反非主键之间有依赖关系,但是因为已经满足2NF(所有非主键都依赖主键),所以一般分为2(n)个表,2个事物。