目录
1、前言
在实际开发中,往往数据是来自不同的表,所以需要多表联合查询,多表查询是对多张表的数据取笛卡尔积。
这里就需要简单了解下笛卡尔积的概念了:
集合A {a1,a2,a3} 集合B {b1,b2},他们的 笛卡尔积 是 A*B = { (a1,b1), (a1,b2), (a2,b1), (a2,b2), (a3,b1), (a3,b2)}任意两个元素结合在一起。
如上图所示,笛卡尔积就是把这两个表放到一起进行计算,分别取出第一张表的每一行,和第二张表的每一行配对,得到一个新的记录。
2、联合查询
有了上述笛卡尔积的认识,我们就来使用下联合查询,首先准备 student,class 这两张表,并且增加相关的数据:
create table student (
id int primary key,
name varchar(20),
classId int
);
create table class (
classId int primary key,
name varchar(20)
);
insert into student value
(23001, '张三', 1),
(23002, '李四', 2),
(23003, '王五', 1),
(23004, '赵六', 3),
(23005, '孙七', 3);
insert into class value
(1, 'java1班'),
(2, 'java2班'),
(3, 'java3班');
有了上述的数据后,我们就来进行简单的联合查询(通过 student class 表 查询出每个学生对应的班级):
这里我们发现,同时查询两张表,进行了笛卡尔积,跟我们上述画的图是一样的效果,但是这里我们发现有很多无效的元素,按道理来说,张三的 classId 为 1,对应 class 表应该是 java1 班的,所以这里的数据是存在很多无效数据的,此时我们就可以使用 where 条件来进行筛选:
有了筛选条件后,显然发现就没有了那些无效的数据了,此时我们再次省略我们不想要的列,只保留学生姓名和班级名称就好了:
这样一来得到的结果就是我们想要的结果了。
上述可能有一个点之前没有说过,比如 student.classId 和 class.classId,这里为什么要加 表名. 前缀呢?由于我们进行的是多表查询,势必可能会出现不同表中存在相同的列名,这里我们就需要告诉 MySQL 是那个表中的列。如果不加表名,这时就区分不了是哪个表的列了,随之就会报错!
上述是最基础的多表查询,后面我们就来用案例来学习更复杂的多表查询。
3、内连接和外连接
在大多数情况下,都是没有啥区别的,比如要连接的两个表中,里面的数据都是一一对应的,这个时候就没有区别,如果不是一一对应,内连接和外连接就有区别了。
这里我们有这样的两张表,通过看数据可以发现,student表中张三在score表中是没有成绩的,而score表中studentId为4是没有对应学生的。我们就用上述两张表进行联合查询演示下外连接和内连接的区别:
select * from student, score where student.id = score.studentId;
select * from student join score on student.id = score.studentId;
-- 这两种的写法都是一样的效果
+------+--------+-----------+-------+
| id | name | studentId | java |
+------+--------+-----------+-------+
| 1 | 张三 | 1 | 89.00 |
| 2 | 李四 | 2 | 92.00 |
+------+--------+-----------+-------+
上述的写法都属于内连接,此处查询结果中,最终剩下的就是两个表里都有的数据,都能关联上的数据,如果使用外连接,那么结果就不相同了。
● 左外连接:
select * from student left join score on student.id = score.studentId;
● 右外连接:
select * from student right join score on student.id = score.studentId;
我们对比这两种两种连接方式,来观察他们的区别:
- 左外连接会把左表的结果都列出来,哪怕右表中没有相应的数据,就使用 NULL 来填充
- 右外连接会把右表的结果都列出来,哪怕左表中没有相应的数据,就使用 NULL 来填充
后续为了演示更复杂的多表查询,以及结合实际的情况,这里我们需要重新构建四张表:
create table classes (
id int primary key auto_increment,
name varchar(20),
synopsis varchar(100)
);
create table student (
id int primary key,
name varchar(20),
qq_mail varchar(20) ,
classes_id int
);
create table course (
id int primary key auto_increment,
name varchar(20)
);
create table score (
score decimal(3, 1),
student_id int,
course_id int
);
由于插入数据部分代码太多,不方便放入文章里,大家可以自行录入,也可以去博主的主页去下载现成的 SQL 文件哦。
4、案例演示
4.1 查询篮球哥每科的成绩
此时要注意篮球哥的信息在 student 表中,而成绩在 score 表里,课程名又在 course 表中,而 score 表中包含了 sutdent_id 以及 course_id:
select student.name as '姓名', course.name as '课程名', score.score as '分数'
from student, score, course
where student.id = score.student_id and
score.course_id = course.id and
student.name = '篮球哥';
这里为了大家看的方便,就进行了换行,最终我们只需要显示三个字段,数据来源于 student,score,course 表,接下来就是 where 条件部分了,相信也是清晰明了的。
4.2 查询所有同学的总成绩及邮箱
此时要用到 student,score 这两个表,并且还要使用聚合函数进行求每个同学的总分,也就是要对每个同学的 id 进行分组后,成绩求和。
select student.name, sum(score) as '总分', student.qq_mail
from student, score
where student.id = score.student_id
group by student.id;
-- 成绩表对学生表是多对1关系,查询总成绩是根据成绩表的同学id来进行分组的
这里交大家一个简单的方法读 sql 语句,select 后面最终显示的列,from 后面是数据来源的表,where 是进行筛选的条件,group by 是按照某个字段进行分组。这样一来就简洁明了了。
5、自连接
自连接就是自己跟自己笛卡尔积,这不是一个通用的解决方案,而是特殊问题的特殊处理方法,自连接的效果就是把 行 转换成 列,这里我们举个例子:
5.1 显示所有计算机原理成绩比java成绩高的同学
select * from score, score;
-- ERROR 1066 (42000): Not unique table/alias: 'score'
这里发现直接自己跟自己笛卡尔积会报错,说名字重复了,不是唯一的,可以采用取别名的方式来解决这个错误:
select * from score as s1, score as s2;
首先我们要明确这 java 和 计算机原理 的课程 ID 是多少:
select * from course;
+----+--------------------+
| id | name |
+----+--------------------+
| 1 | Java |
| 2 | 中国传统文化 |
| 3 | 计算机原理 |
| 4 | 语文 |
| 5 | 高阶数学 |
| 6 | 英文 |
+----+--------------------+
-- 6 rows in set (0.00 sec)
得到了 java 和 计算机原理 的 id 之后,对 score 表自身进行笛卡尔积,就可以指定 s1.class_id = 1 and s2.class_id = 3 这样的条件,也就是将一行中 s1 表显示 java, s2 表显示计算机原理:
select * from score as s1, score as s2 where s1.course_id = 1 and s2.course_id = 3;
此查询结果还存在无效的数据,比如 s1.student_id 与 s2.student_id 应该是一样的, 因为我们查询的是谁的计算机原理比Java成绩高,所以我们还要加上一个条件:
select * from score as s1, score as s2
where s1.course_id = 1
and s2.course_id = 3
and s1.student_id = s2.student_id;
现在这个结果是满足 id 相等,同时满足了要比较的科目,现在就差一个条件了!就是 s1.score < s2.score 这就表示查询的是 java 成绩小于 计算机原理的同学:
select * from score as s1, score as s2
where s1.course_id = 1
and s2.course_id = 3
and s1.student_id = s2.student_id
and s1.score < s2.score;
最后我们对这个结果保留想要的字段,并且增加 student.name 这个字段,注意增加 student.name 表示要多一个student 表一起进行笛卡尔积,所以我们还要加一个条件 student.id = s1.student_id,这样才是最终完整的结果:
select student.name, s1.score as Java, s2.score as 计算机原理
from student, score as s1, score as s2
where s1.student_id = s2.student_id
and s1.course_id = 1
and s2.course_id = 3
and s1.score < s2.score
and student.id = s1.student_id;
以上就完整的查询出了 计算机原理成绩大于Java成绩的同学了! 这个过程看似复杂,但不要着急,静下心来一步步分析,阅读 SQL,相信你能理解的!
6、子查询
子查询本质就是套娃,实际开发中,慎重使用,子查询可能会构造出非常复杂,非常不好理解的 SQL,对于代码的可读性就大大降低了,对于 SQL 的执行效率,也有可能是毁灭性的打击!
6.1 查询出篮球哥的同班同学
正常情况下,先查询出篮球哥的班级id,然后条件设置为 claases_id 跟 篮球哥的班级id 相同即可,并排掉篮球哥:
select classes_id from student where name = '篮球哥';
-- 1
select * from student where classes_id = 1 and name != '篮球哥';
这样就能求出篮球哥的同班同学,但是子查询是如何写的呢?
select * from student where classes_id = (select classes_id from student where name = '篮球哥') and name != '篮球哥';
子查询的写法其实就是套娃!把一个查询的结果,作为另一个查询的一部分条件(此处作为另一个一部分查询条件的查询结果只能返回一条数据) 。
6.2 多行子查询
● 查询语文或英文课程的成绩信息
正常情况下,我们需要先查询出语文和英文的课程id,然后去成绩表中查询对应课程id 的成绩:
select id from course where name = '语文' or name = '英文';
-- 4 6
select * from score where course_id = 4 or course_id = 6;
如果要用多行子查询就需要利用 in 关键字:
select * from score where course_id in (select id from course where name = '语文' or name = '英文');
如果查询是排除语文英文信息呢?就使用 not in 就行,可以把 in 理解成再这个范围内,整体查询结果必须满足 in 后面子查询的结果范围。
这里的套娃是无穷无尽的,一般不建议这样做,实际上更推荐是直接多步完成查询就好,没必要强行合成一个!
7、合并查询
合并查询就比较简单了,本质上就是把两个查询的结果集合并成一个。
● 查询课程id小于3,或者课程名为英文的课程
select * from course where id < 3 union select * from course where name = '英文';
这里可能有小伙伴就很奇怪,这中间直接来个 or 不就行了吗?是的!
注意:这里的 union 是可以来自于不同的表,只要查询的结果的列匹配即可,而 or 只能是同一表。
除了 union 还有一个 union all,他们区别不大,union 是会进行去重(重复的行只会保留一份),而 union all 是不会去重的!