简单了解数据库
一,什么是SQL?
1,SQL是Structured Query Language(结构化查询语言)的缩写。
2,SQL是专为数据库而建立的操作命令集,是一种功能齐全的数据库语言。
3,在使用SQL时,只需要发出“做什么”的命令,“怎么做”是不用使用者考虑的。
二,数据库的构成:
1,数据(Data)
2,数据库(Database)
3,数据库管理系统(DBMS)
4,数据库系统(DBS)
三,数据(Data)
1,数据的定义:
①对客观事物的符号表示,如图形符号、数字、字母等,数据是数据库中存储的基本对象。
②在日常生活中,人们直接用语言来描述事物;在计算机中,为了存储和处理这些事物,就要将事物的特征抽象出来组成一个记录来描述。
2,数据的种类:
文字、图形、图象、声音
四,数据库(Database)
1,数据库的定义
①长期储存在计算机内的、有组织的、可共享的数据集合。
②数据库中的数据按一定的数据模型组织、描述和储存。
③具有较小的冗余度、较高的数据独立性和易扩展性,并可为各个用户共享。
五,数据库的管理系统(DBMS)
1,什么是DBMS?
①位于应用程序与存储数据的之间的一层数据管理软件。
②是基础软件,是一个大型复杂的软件系统
2,DBMS的用途(也是数据库的用途)
科学地组织和存储数据、高效地获取和维护数据
3,DBMS的主要功能
①数据库的定义功能:
它把用DDL编写的各级源模式编译成各级目标模式,这些目标模式是对数据库结构信息的描述,而不是数据本身,它们被保存在数据字典中,供以后数据操纵或数据控制时使用。
②数据库的操作功能:
单独数据操纵语言DML及其编译程序,实现对数据库的基本操作。基本操作有两类检索和更新。
③数据库的保护功能:
数据库的数据恢复、数据库的并发控制、数据完整性控制和数据安全性控制。
④数据库的维护功能:
数据库的数据导入、转换、存储、数据库性能监控等。
4,DBMS的优点
①相互关联的数据的集合
②较少的数据冗余
③程序与数据相互对立
④保证数据的安全、可靠、正确
⑤数据可以并发使用并能同时保证一致
六,数据库系统(DBS)
1, 一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。
DBS=DB+DBMS+应用系统+数据库管理员(DBA)+用户
2,数据库系统的发展经历了3个阶段:
网状数据库、层次数据库和关系数据库。
3, 它们分别采用网状模型、层次模型和关系模型作为数据的组织方式。
①网状模型(图形结构)
②层次模型(树形结构)
③关系模型(简单二维表结构)
4,DBS的基本概念
信息和数据:
信息:是指数据经过加工处理后所获取的有用知识。信息是以某种数据形式表现的。
5,信息的3种世界
(1)现实世界
现实世界就是存在于人脑之外的客观世界。
(2)信息世界
信息世界就是现实世界在人们头脑中的反映,又称观念世界。
(3)数据世界
数据世界就是将信息世界中的信息经过抽象和组织,按照特定的数据结构,将数据存储在计算机中。
七,实体-联系-模型
1,实体:
客观事物在信息世界中称为实体(Entity),它是现实世界中任何可区分、识别的事物。
2,属性:
描述实体特征的数据项
3,联系:
反映实体与实体之间的关联集合
常见的实体联系有3种:一对一联系、一对多联系和多对多联系。
八,关系模型(Relational Model)
1,关系的基本概念
一个关系就是一张二维表,通常将一个没有重复行、重复列的二维表看成一个关系,每个关系都有一个关系名(表名)。
2,元组:
二维表的每一行在关系中称为元组。在MySQL中,一个元组对应表中一个记录。
3,属性:
二维表的每一列在关系中称为属性,每个属性都有一个属性名,属性值则是各个元组属性的取值。列也可以被称为字段。
4,域:
属性的取值范围称为域。域作为属性值的集合,其类型与范围具体由属性的性质及其所表示的意义确定。同一属性只能在相同域中取值。
5,关键字:
关系中能唯一区分、确定不同元组的属性或属性组合,称为该关系的一个关键字。
6,关系模式
对关系的描述称为关系模式,其格式为:
关系名(属性名1, 属性名2, ……, 属性名n)
也就是表名(列名1,列名2,.........,列名n)
7,关系的基本特点
在关系模型中,关系具有以下基本特点:
①关系必须规范化,属性不可再分割。
②在同一关系中不允许出现相同的属性名。
③在同一关系中元组的顺序可以任意。
④在同一关系中属性的顺序可以任意。
8,关系运算
关系运算主要有选择、投影和连接3种。
①选择:从关系模式中找出满足给定条件的元组组成新的关系(也就是说,从行的角度进行的运算)
②投影:从关系模式中指定若干属性组成新的关系(也就是说,从列的角度进行的运算)
③连接:从两个关系的笛卡儿积中选取属性间满足一定条件的元组,组成新的关系
a,假设集合A={a, b},集合B={0, 1, 2},则两个集合的笛卡尔积为{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}。
b,类似的例子有,如果A表示某学校学生的集合,B表示该学校所有课程的集合, 则A与B的笛卡尔积表示所有可能的选课情况。
9,关系的完整性约束
(1)实体完整性
主属性值(主关系键的值)不能取空值(也就是说,主键不能为空)
如:学生信息表(学号,姓名,性别,年龄,地址)中,学号不能为空。
(2)参照完整性(引用完整性)
简单说就是主键与外键的关系。
如学生表与选课表之间用学号建立关联。学生表是主表,选课表是从表。若向从表中输入一条新纪录,系统会检查记录的学号是否在主表中存在。若存在,则允许此操作,否则将拒绝输入。
(3)域完整性(用户定义完整性)
限制了某些属性中出现的值,把属性限制在一个有限的集合中。
如若属性类型是正整数,那么输入值则不能为小数等其它任何非整数。
10,关系模型的规范化
关系模式要满足的条件称为规范化形式,简称范式(NF)。
关系模型规范化的目的:
是为了消除存储异常,减少数据冗余,保证数据的完整性和存储效率,一般规范为3NF即可。
(1)第一范式(1NF)
如果关系R的所有属性均为简单属性,即每个属性都是不可再分的,则称R满足第一范式。
简单来说:第一范式就是无重复的列
(2)第二范式(2NF)
如果关系R满足第一范式,且每一个非主键字段完全依赖于主键,则称R满足第二范式。
简单说,就是把表里的某一个列设置为主键以后,就可以根据这个列查到其他相关列的信息
学生:Student(学号,姓名,年龄);
课程:Course(课程名称,学分);
选课关系:SelectCourse(学号,课程名称,成绩)。
(3)第三范式(3NF)
如果关系R满足第二范式,且非主键字段之间不存在依赖关系,则称R满足第三范式。
简单说,就是从表只能引用主表中的一个列。
存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。
那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。
一个基本的关系型数据库,要满足第一范式,一个完整的关系型数据库,要满足第三范式。
九,E –R 图
E-R图也称实体-联系图(Entity Relationship Diagram),提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。
通常用矩形表示实体型,矩形框内写明实体名
用椭圆表示实体属性,椭圆内写明实体属性名
用菱形表示实体型间的联系,在菱形内写明联系名
用线段连接起来