数据库管理技术的产生和发展
数据库技术是应数据管理任务的需要而产生的。数据库管理是指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题。而数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。
数据库管理技术经历了人工管理、文件系统、数据库系统三个阶段。从文件系统到数据库系统标志着数据管理技术的飞跃。
一、人工管理阶段
20世纪50年代中期以前,计算机主要用于科学计算,硬件:没有磁盘、硬盘等直接存取的存储设备;软件:没有操作系统,没有管理数据的专门软件;数据处理方式是批处理。特点:
- 数据不保存。
- 应用程序管理数据:程序员负担重。
- 数据不共享:程序与程序之间有大量的冗余数据。
- 数据不具有独立性:数据完全依赖应用程序。
二、文件系统阶段
20世纪50年代后期到60年代中期,硬件:有直接存取存储设备;软件:有专门的数据管理软件(文件系统);处理方式上不仅有批处理,还有联机实时处理。特点:
- 数据可以长期保存:可以反复进行增删改查操作。
- 由文件系统管理数据
- 数据共享性差,冗余度大。
- 数据独立性差:是一个不具有弹性的无整体结构的数据集合,即文件之间是孤立的,不能反映现实世界事物之间的内在联系。
综述:使用文件系统时,程序员要关注记录的结构和不同文件中记录之间的联系,使用文件系统提供的fopen(打开)、fread(读)、fwrite(写)、fseek(移动读写位置)、fclose(关闭)等操作来编程,工作量大、编程复杂,且开发速度较慢。
三、数据库系统阶段
20世纪60年代后期以来,出现了统一管理数据的专门软件系统–数据库管理系统。特点:
- 数据机构化:数据库系统实现整体数据的结构化是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
“整体”结构化:数据库中的数据不再仅仅针对某一个应用,而是面向整个组织或企业;不仅数据内部是结构化的,而且整体是结构化的,数据之间是具有联系的。 - 数据的共享性高、冗余度低且易扩充:大大减少数据冗余,节约存储空间,还能避免数据之间的不相容性与不一致性。
备注:数据的不一致性是指同一数据不同副本的值不一样。 - 数据独立性高
1)物理独立性:用户的应用程序与数据库中数据的物理存储是相互独立的。
2)逻辑独立性:用户的应用程序与数据库的逻辑机构是相互独立的,数据的逻辑改变时用户程序可以不变。 - 数据由数据库管理系统统一管理和控制
1)数据的安全性保护
保护数据以防止不合法使用造成的数据泄密和破坏。
2)数据的完整性检查
将数据控制在有效的范围内,并保证数据之间满足一定的关系。
数据的完整性指数据的正确性、有效性和相容性。
3)并发控制
对多用户的并发操作加以控制和协调。
4)数据库恢复
将数据库从错误状态恢复到某一已知的正确状态(完整状态或一致状态)的功能。
综述:数据库是长期存储在计算机内有组织、大量、共享的数据集合。它可以提供各种用户共享,具有最小冗余度和较高的数据独立性。数据库管理系统在数据建立、运用和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
图为数据库管理三个阶段的比较