SQL一文入门助记

时间:2022-12-09 15:08:18

什么是SQL

SQL(Structured Query Language)是用于操作数据库的语言。一个博客有许多网站,一个游戏要储存许多游戏的账号密码,这些都离不开数据库操作。

关系型数据库与NoSQL

关系型数据库就是一个表格,每一个横行就是每一条数据,每一个纵列就是每条数据有哪些信息:

id name score gender
1 Alice 90 F
2 Bob 92 M
3 Carol 90 F
4 David 98 M

常见的关系型数据库: Oracle、MySql、Microsoft SQL Server、SQLite

非关系型数据库就是没有这些限制的数据库,他们结构更*,通常数据自身就以对象的方式存储,NoSQL 往往为某些特别数据量身打造,在许多场合效率更高。

常见的 NoSQL 数据库:MongoDB、Redis、Memcached、HBase

但总体而言,SQL 的使用场合多得多,NoSQL 意为"Not Only SQL",用于辅助 SQL 数据库,而非取而代之。

MySQL, SQL 与 InnoDB

SQL 是一种结构化查询语言,是一门 ANSI 标准的计算机语言,但是仍然存在着多种不同版本的 SQL 语言。在不同的软件里,每款数据库的 SQL 语法通常有区别。但在基本的增删改查功能上他们是一样的,但某个特型数据库提供的 SQL 语句可能就不能在其他地方执行了。

SQL语句通常不区分大小写,但一般关键字用大写;SQL语句末尾要打分号。SQL以--comment为单行注释,/* comment */为多行注释。

MySQL 是一款优秀的 SQL 软件,是目前应用最广泛的开源关系数据库之一。MySQL最早是由瑞典的 MySQL AB 公司开发,该公司在2008年被 SUN 公司收购,紧接着,SUN 公司在 2009 年被 Oracle 公司收购,所以 MySQL 最终就变成了 Oracle 旗下的产品。这篇文章以 MySQL 为载体,介绍最简单的 SQL 语句。

而 MySQL 本身也只是一个接口,内部的引擎(真正做增删改查的)被分离出来了,称作数据库引擎,常用的引擎之一是 InnoDB。

MySQL 分免费版和付费版,他们的代码功能是一样的,付费版多出来的功能是一些管理功能。

免费版下载:https://dev.mysql.com/downloads/mysql/

Mysql 和 mysqld

安装完成后通常服务会自己启动,这个服务是运行在后台的,此时我们可以用 python,node 等连接,也可以用mysql控制台连接:

mysql -u root -p

-u代表用户名,-p代表接下来输入密码,默认密码应该是root。见到提示符mysql>后,就可以手动操作了。

如果重启了电脑,后台SQL服务就关闭了,输入mysqld即可再次启动。

创建数据库和数据表

一个软件里有几个数据库,一个数据库里有几个数据表;SHOW databases;查看数据库;USE ***;选中一个数据库;SHOW tables;查看这个数据库里面的数据表。

CREATE DATABASE test; --创建数据库
USE test;
CREATE TABLE students(
	id INT, 
	name varchar(100),
	score INT,
	gender varchar(100)
); --创建表
SHOW CREATE TABLE students; --查看刚刚创建students的语句
DESC students; --查看表的字段信息
TRUNCATE TABLE students; --清空表数据,但表还在
DROP TABLE students; --删除表
DROP DATABASE test; --删除数据库

DESC 将输出字段信息:

+-------+--------------+------+-----+---------+-------+
| Field | Type         | Null | Key | Default | Extra |
+-------+--------------+------+-----+---------+-------+
| id    | int(11)      | YES  |     | NULL    |       |
| name  | varchar(100) | YES  |     | NULL    |       |
+-------+--------------+------+-----+---------+-------+

SELECT 查询

SELECT用于选取数据。

SELECT * FROM table1; --从table1中选取所有数据
SELECT id,score FROM students;  --从students中选取id列和score列(name列不会返回,返回的数据是两列)
SELECT score/2 FROM students; -- 输出score除以2的值,列名就叫score/2
SELECT DISTINCT score FROM students;  --列出score列其中所有不同的值,返回的score列里同分的只保留一个

AS 选取别名

你可以为每个列名选取一个别名,直接附在列名的后面就可以了

SELECT id AS stunumber,score AS point FROM students;

输出列表头的id会变成stunumberAS通常可以省略

WHERE 条件

WHERE 子句用于提取那些参数满足指定条件的记录。

WHERE后的条件是布尔判断值可以使用关系运算符,不等号用<>表示,不能连等,字符串按字典序;也可以用NOT AND OR逻辑运算符,优先级从前往后,可以加上括号改变优先级。

SELECT * FROM students WHERE score>=95; --只返回score值大于等于95的横行记录
SELECT * FROM students WHERE 85<=score AND score<=90 AND gender = 'M'; 
--返回score在85到90且gender是M的行

BETWEEN、LIKE 和 IN

  • BETWEEN表示“在……之间”,如85<=score AND score<=90等价于BETWEEN 85 AND 90(左闭右闭);

  • IN表示“在这……其中”,可在多个之中选择,如gender='M' OR gener='F'等价于gender IN ('M', 'F')

  • LIKE用于字符串通配,如WHERE name LIKE '%a'表示“以a结尾的”。在SQL中,%代表0,1或多个任意字符,_代表一个任意字符;[a-z][^123]等则代表选定的字符集之一,规则同正则表达式

ORDER BY 排序

这个用于排序,排序输出的数据。

SELECT id,score FROM students ORDER BY score; --按score从小到大
SELECT id,score FROM students ORDER BY score DESC; --按score从大到小
SELECT id,score FROM students ORDER BY score DESC, id; --按score从大到小,同分再按id从小到大

语句是串联起来的,ORDER BY放到WHERE之后,先筛选,再排序。

LIMIT 只返回部分数据

如果返回的数据太多了,我们可以使用LIMIT只返回一部分数据

SELECT * from table1 LIMIT 3; --只取前三个数据
SELECT * from table1 ORDER BY score LIMIT 3; --排序后取前三个
SELECT * from table1 LIMIT 3 OFFSET 4; --从第四个数据开始(0based)只取前三个数据,即4, 5, 6行。超出下标的忽略

并非所有数据库都支持LIMIT - OFFSET语法,但每款软件都有自己的选取数据语法。

INDEX 索引

如果经常根据某一列进行查询,可以根据这一列创建索引:

CREATE INDEX indexofscore ON students (score);
ALTER TABLE students ADD INDEX indexofscore (score, id); --都可以创建索引

CREATE UNIQUE INDEX indexofscore ON students (score);--创建一个唯一索引,保证 score 唯一
ALTER TABLE students DROP INDEX indexofscore; --删除索引

索引的效率取决于索引列的值是否散列,即该列的值如果越互不相同,那么索引效率越高。反过来,如果记录的列存在大量相同的值,例如gender 列,大约一半的记录值是 M,另一半是 F,因此,对该列创建索引就没有意义。

索引将加入额外信息维护数据,使查询更快;但在增删改时也要更新索引,所以修改数据会变慢。

增删改

INSERT INTO 插入

插入几行数据

INSERT INTO table1 VALUES (value1,value2,value3); 
--插入一列(value1,value2,value3)到table1表,按顺序对应原来的列

INSERT INTO students (score,id,gender)
VALUES (89,5,'M'), (90,6,'M'); --可以指定每个数据对应的列,可以插入多个数据

修改完成后会返回信息,有多少行被修改
Query OK, 6 rows affected (0.02 sec)
Rows matched: 6 Changed: 6 Warnings: 0

UPDATE 更新

修几行的数据

UPDATE table1
SET column1 = value1, column2 = value2, ...
WHERE condition;

对于每个符合 WHERE 条件的行,修改 SET 里指定的数据列,如果没有WHERE条件,就修改全部的数据

UPDATE students SET score=100 WHERE gender='M'; --gender为M的全部修改为100分
UPDATE students SET score=score+id WHERE gender='M'; --gender为M的全部加上id。(不能用+=)

DELETE 删除

删除一些行的数据

DELETE FROM table1 WHERE condition;
DELETE FROM students WHERE score>100;

每个符合 WHERE 条件的行都会被删除,如果没有WHERE条件,整个表的行都被删除。

JOIN 连接查询

现在每个学生还有一个班,为了表示每个学生的班,再加一列 class:

id name score gender class
1 Alice 90 F 1
2 Bob 92 M 2
3 Carol 90 F 3
4 David 98 M 2

在另一个表 classes 里,是每一个班的名字:

id name
1 火箭班
2 自动化
3 编程班
4 战神班

现在要查询全体学生所在的班,也就是查询 student 表的同时根据 student.class 再到 classes 表中附上一列 class.name,这就要用到连接查询。

SELECT * FROM students /*选取 students 里的数据*/
INNER JOIN classes  /*并和 classes 取积*/
ON students.class=classes.id;  /* 保留 students.class=classes.id 的值*/

我们得到的两个表拼起来后的输出:

+----+-------+-------+--------+-------+----+-----------+
| id | class | name  | gender | score | id | name      |
+----+-------+-------+--------+-------+----+-----------+
|  1 |     1 | Alice | F      |    90 |  1 | 火箭班    |
|  2 |     1 | Bob   | M      |    92 |  1 | 火箭班    |
|  3 |     1 | Carol | F      |    90 |  1 | 火箭班    |
|  4 |     2 | David | M      |    98 |  2 | 自动化    |
+----+-------+-------+--------+-------+----+-----------+

如果没有 ON,那么就不会筛选数据,直接取两个表的直积(16个数据)

AS 给表取别名

上面表中 id 和 name 都重复出现了,如果不用 SELECT *,而是只取部分列,要用“表名.列名”的方式区分开(students.id 和 classes.id),而表的名字多次出现 太长了,可以为他设置别名(AS 可以省略)。

SELECT s.id, c.name AS classname, s.name, s.gender, s.score FROM students AS s 
INNER JOIN classes AS c
ON s.class=c.id; 

这样就符合我们的阅读习惯了:

+----+-----------+-------+--------+-------+
| id | classname | name  | gender | score |
+----+-----------+-------+--------+-------+
|  1 | 火箭班    | Alice | F      |    90 |
|  2 | 火箭班    | Bob   | M      |    92 |
|  3 | 火箭班    | Carol | F      |    90 |
|  4 | 自动化    | David | M      |    98 |
+----+-----------+-------+--------+-------+

各种形式的 JOIN

SQL一文入门助记

  • INNER JOIN:将集合取直积,并只返回符合条件的数据。

  • LEFT (OUTER) JOIN:确保左表的每一行都保留,如果左表有一行配不上任何右表,他仍会显示出来,在右表有关的列显示 NULL。

  • RIGHT (OUTER) JOIN:同上,确保左表的每一行都保留。如果把上面的例子改成 RIGHT JOIN,就会多出一行没有人的“战神班”,其他列全为 NULL

  • FULL (OUTER) JOIN:结果上,FULL JOIN 同时拥有 LEFT JOIN 和 RIGHT JOIN 多出来的行。MySQL 是不支持 FULL JOIN 的。

SQL一文入门助记

数据库操作和关系模型

Primary Key 主键

关系数据库里,每一行是一条“记录”,每一列是一个“字段”。两条记录不能完全相同,至少要有一个能区分他们的字段,使每条数据都不相同,这个字段叫做主键(Primary Key)。比如在上面的 students 表里,性别和分数可以相同,名字也可以一样,id就适合成为主键,每个 id 可以唯一定位到一个人。

主键是用来直接定位一个记录的,一旦插入就最好不要更改。

数据类型

这是关系数据库,所以每个字段要有唯一的类型,在 students 表中,id、score是整数,而 name、gender则是字符串。

一些类型 描述
INT 32位有符号整数
BIGINT 64位有符号整数
REAL/FLOAT 32位IEEE浮点
DOUBLE 64位IEEE浮点
DECIMAL(p,s) 精确十进制实数,最多p位,小数位最多s位
CHAR(n) 定长度为 n 的字符串
VARCHAR(n) 变长字符串,最长为n
BOOLEAN true或者false
DATE/TIME/DATETIME 储存日期,时间。不同数据库规则有差异

一般最常见的就是整数 INT 和 字符串 VARCHAR(n)。

Constraints 约束

每一个字段都可以有自己的约束规则,比如不能为空(NOT NULL),唯一(UNIQUE)等等。上面的PRIMARY KEY也是一种约束。约束在创建表的时候就可以添加在数据类型后面或者使用CONSTRAINT单独添加。

CREATE TABLE table_name(
	column_name1 type constraint_name,
	column_name2 type constraint_name,
	column_name3 type constraint_name,
	CONSTRAINT constraint_name ……
);

CREATE TABLE Orders(
	O_Id int NOT NULL,
	OrderNo int NOT NULL CHECK (OrderNo>0),
	P_Id int,

	PRIMARY KEY (O_Id),
	CONSTRAINT fk_PerOrders FOREIGN KEY (P_Id) REFERENCES Persons(P_Id)
)
  • NOT NULL:表示本字段不接受 NULL 值,必须给定值。

  • UNIQUE:保证该字段在表中不重复

  • PRIMARY KEY:表示这是主键,主键只能有一个,数据上的限制相当于 NOT NULL 加上 UNIQUE

  • FOREIGN KEY:表示这是外键,每个外键中的值对应另一个表中的 UNIQUE,比如 students.class 就是指向 classes.id 的外键。逻辑上, students.class 就是用来对应 classes.id 的,即使没有显式指明外键也能连接查询;指定外键后语义更明确,程序会预防插入非法值,外键必须在另一个表里存在,但使用外键也会占用更多的资源。

  • CHECK:为字段添加条件约束,如CHECK (OrderNo>0)限制只能取正数

  • DEFAULT:为字段添加默认值,如score INT DEFAULT 60不给定分数的值,默认赋值60

  • AUTO_INCREMENT:表明该字段无需赋值,每次创建时都会自动加一,多用于没有实际意义的主键。

NULL 的应用

没有限定NOT NULL,没有默认值又没有给定值的数据就是 NULL。WHERE 条件中判定 NULL 不能用等于号。

SELECT score FROM students WHERE score IS NOT NULL; --IS NULL表示是NULL;IS NOT NULL表示不是NULL
SELECT id, IFNULL(score,0) FROM students; --有分数的输出分数,分数为NULL的输出成0

函数

SQL 语句里提供丰富的函数供我们使用,一类是聚合(aggregate)函数,另一类是标量(scalar)函数

标量函数

这些函数进一个值,出一个值,没有什么特殊的。如:

  • LEN():字符串长度
  • ROUND():浮点数四舍五入
  • UCASE():字符串转为大写
  • NOW():当前时间

聚合函数

聚合函数参数是表中的一列,输出一个数。

  • AVG():返回平均值
  • SUM():返回和
  • COUNT():返回长度
  • MIN() MAX():返回最值
SELECT COUNT(id) FROM students; --一共有多少个id,即数据数量,输出列名就是COUNT(id),只有一条数据
SELECT AVG(score) FROM students; --求平均分
SELECT class, AVG(score) FROM students; --这是错误的,class列有四行,AVG(score)只有一行,拼不出表

GROUP BY 分组查询

上面的第三句失败了,如果我想查询每个班的平均分,那应该使用 GROUP BY 查询:

SELECT class, AVG(score) FROM students 
GROUP BY class;

按照class分组,每一组计算一个 AVG(score),所以 AVG(score) 有了三行,class也是三行,输出的就是每个班的平均分。GROUP BY也可以接受几个值,把值不一样的都分开统计,比如GROUP BY class, gender可以统计每个班每个性别的平均分。

GROUP BY 想和条件筛选一起用怎么办?WHERE 可以在 GROUP BY 之前用,但不能放在 GROUP BY 之后,如果是函数算出的东西还要筛选,HAVING 就排上了用场。

SELECT class, AVG(score) FROM students GROUP BY class
HAVING AVG(score)>90; --筛选平均分大于90的班