用存储过程、定时器、触发器来解决数据分析问题

时间:2023-01-09 09:56:02

做数据分析或者数据处理,我们也需要掌握这些技能,来解决特定的业务问题。比如:做自动化报表,如果数据需要每天实时更新(增量爬虫)、定时计算某个业务指标 、想要实时监控数据库表中的数据增、删、改情况等。

文章大纲

用存储过程、定时器、触发器来解决数据分析问题

一、存储过程

1、啥是存储过程,有什么用?

  • 过程 :将若干条 SQL 语句封装起来,起个名字

  • 存储过程 : 我们将此过程存储在数据库中,有点类似于编程中用到的函数,区别是函数有返回值,而过程没有返回值,相同点是将代码封装可复用,可传参,调用即可执行。

  • 好处:① 代码封装可复用 ② 可以接收、返回参数 ③ 减少网络交互、提升效率

2、存储过程如何使用

创建

create procedure 名称()
begin
  sql语句;
end

用存储过程、定时器、触发器来解决数据分析问题

查看

show procedure status;

用存储过程、定时器、触发器来解决数据分析问题

调用

call 名称();
 

用存储过程、定时器、触发器来解决数据分析问题

删除

drop procedure if exists 名称;

3、存储过程中的变量

变量的种类和定义

在 SQL 中变量分为两种:

  • ① 系统变量:@@

  • ② 自定义变量:@

用存储过程、定时器、触发器来解决数据分析问题

用存储过程、定时器、触发器来解决数据分析问题

存储过程是可以编程的,意味着可以使用变量、表达式、控制结构,在存储过程中,声明变量用 declare

格式:declare 变量名 变量类型 【default 默认值】

用存储过程、定时器、触发器来解决数据分析问题

变量运算与控制结构

变量的赋值,有两种方式:

  • ① set 变量名 = 值

  • ② set 变量名 := 值

用存储过程、定时器、触发器来解决数据分析问题

if | else 控制结构语法格式

if  条件1 then
  sql 语句;
else if 条件2 then
  sql 语句;
else
  sql语句;
end if

用存储过程、定时器、触发器来解决数据分析问题

存储过程中的参数传递

为了让存储过程更加灵活,可以传递参数,参数分为三种:

  • ① in:参数作为输入,调用时传入

  • ② out:参数作为输出,可以作为返回值

  • ③ inout:参数即可传入又可输入

格式: in|out|inout 参数名 参数类型

用存储过程、定时器、触发器来解决数据分析问题

存储过程中使用循环

while 循环格式:

while 条件 do
  sql 语句;
end while

打印 1 - 100 之和

用存储过程、定时器、触发器来解决数据分析问题

带输入参数n,求1-n之和

用存储过程、定时器、触发器来解决数据分析问题

要求带输入参数 n,和输出参数 total ,求1-n 之和

用存储过程、定时器、触发器来解决数据分析问题

要求 age 既是输入又是输出变量,传入一个年龄,就增加 20

用存储过程、定时器、触发器来解决数据分析问题

二、定时器

1、啥是定时器,怎么用?

所谓定时器,就是定时地去运行指定的函数和代码,MySQL 的定时器就是 MySQL 的事件。

在开发过程中经常会遇到这样一个问题:每天或每月需定时去执行一条 SQL 语句或更新或删除数据。在我不了解 MySQL 定时器时,是用 Python 程序代码去操作数据表,再将 Python 程序,放到服务器跑定时任务。现在用定时器,完全可以在数据层面操作了,非常方便。

语法结构

create event [if not exists] 事件名
[definer = user] 可选参数。执⾏事件的⽤⼾,不指定默认就是当前⽤⼾
on schedule 定时时间设置。定义事件执⾏的频率,可以指定具体时间也可以周期性执行
[on completion [not] preserve ] 可选参数。默认是not,表⽰时间过期后会⽴即删除(注意不是不激活);on completion preserve 表⽰时间过期后会继续保留
[enable | disable | disable on slave] 可选参数。默认enable。事件激活、不激活、从服务上不激活(事件在主服务商创建并赋值到从服务器上,仅在主服务上执行)
[comment "注释"] 可选参数。
do 事件内容 定义事件的sql语句,如果语句有多⾏需要⽤ begin end 括起来

指定时间定时执行

at子句:这里要求是timestamp时间格式,⼀般格式是“时间点 + interval 时间单位”。表示在什么时间节点执行,例如:current_timestamp + interval 2 minute

要求:两分钟后往 event_test 表插⼊⼀条语句"事件启动了"

用存储过程、定时器、触发器来解决数据分析问题

用存储过程、定时器、触发器来解决数据分析问题

注意:因为参数默认是 on completion not preserve,事件运行完成后会自动删除

周期时间定时执行:

  • every子句:格式是“数字+时间单位”,表示时间周期,例如:1 hour / 2 minute / 3 second

  • starts子句:可选,跟上 timestamp 值,表示事件开始的时间点,如果没有指定就是当前时间

  • ends子句:可选,跟上 timesatamp 值,表示停止执行的时间,如果没有ends表示无限执行

要求:新建数据表 event_test,每分钟往里面插⼊⼀条数据,到 5 分钟结束

用存储过程、定时器、触发器来解决数据分析问题

用存储过程、定时器、触发器来解决数据分析问题

注意事项

1、需要激活事件,事件才会被执行,show events才可以查看。⼀个是全局参数开启,⼀个是事件的开启

SET GLOBAL event_scheduler = 1;
设置事件的状态为 enable:
ALTER EVENT event_name ON COMPLETION PRESERVE ENABLE; 开启
ALTER EVENT event_name ON COMPLETION PRESERVE DISABLE; 关闭

2、关掉了 navicat,事件不会关闭,关闭了 MySQL 服务器才会被关闭
3、多语句执行的时候,可能需要修改结束分隔符,比如:delimiter $
4、如果事件的开始时间已经过去了,虽然创建语句不会报错,但是事件不会被创建以及执行
5、事件⾥⾯不能嵌套事件,但是存储过程里面可以使用事件
6、在事件中使用 select、show 等返回结果语句没有意义,但是可以用 select into、insert into 等存储结果的语句
7、注意不要短周期内重复事件调度,不然数据会有问题。例如每分钟执行 100w 行数据,那这个会有问题,如果实在是需要那这个时候可以使用行锁、表锁来进行
8、事件⽆法传递参数,但是可以用事件里面的参数使用存储过程

定时器可以结合存储过程

现在用定时器,就可以在数据层面操作,定时去执行sql 语句或一组 sql 语句(存储过程),设置好定时任务,可通过 navicat —— 其它——事件,查看到当前事件的定义,计划,当然也可以手动完成上述操作。

用存储过程、定时器、触发器来解决数据分析问题

用存储过程、定时器、触发器来解决数据分析问题

三、触发器

1、啥是触发器,应用场景是?

触发器是一类特殊的事务,可以监视数据操作(数据表的变更日志),包括 insert | update | delete,并触发相关操作 insert | update | delete,运用触发器,不仅能简化程序,又可以增加程序的灵活性。

应用场景①:当向一张表中添加或删除数据时,需要在相关表中进行同步操作,比如:当一个订单产生时,订单所购的产品的库存量相应减少。

应用场景②:当表中某列数据的值与其他表中的数据有联系时,比如:某客户进行欠款消费,可以在生成订单时,设计触发器判断该用户的累计欠款是否超过最大限度。

应用场景③:跟踪某张表时,比如当有新订单产生时,需通知相关人员进行处理,这时可以在订单表中添加触发器加以实现。

2、触发器如何使用

创建

触发器只支持行级触发(每一行受影响,触发器都执行,叫作行级触发器),不支持语句级触发。

用存储过程、定时器、触发器来解决数据分析问题

Create trigger 触发器名称
before/after  
insert/update/delete
on 表名 for each row #行级触发器
Begin 
    trigger_state;
end

查看

Show triggers;

删除

Drop trigger 数据库.触发器名称;

要求:现有商品表 goods,订单表 orders,当下一个订单时,商品要相应减少(买几个商品,就少几个库存), 分析如下:

  • 监视谁:orders

  • 监视动作:insert

  • 触发时间:after

  • 触发事件:update

CREATE TABLE goods(gid INT,name VARCHAR(10),num SMALLINT);
CREATE TABLE ord(oid INT ,gid INT, buy_num SMALLINT)
INSERT INTO goods VALUES (1,'cat',20),(2,'dog',90),(3,'pig',26);

用存储过程、定时器、触发器来解决数据分析问题

查看商品表

用存储过程、定时器、触发器来解决数据分析问题

创建触发器并查看

用存储过程、定时器、触发器来解决数据分析问题

发现这样写触发器并不灵活

3、触发器引用行变量

使用别名 old、new 来引用触发器中发生变化的记录内容。注意:

用存储过程、定时器、触发器来解决数据分析问题

引用行变量

要求:删除一个订单时,商品要退回,库存量要还原(删)

用存储过程、定时器、触发器来解决数据分析问题

要求:订单表中的数量3 要求改到2,并且让商品表的库存量也变化(改)

用存储过程、定时器、触发器来解决数据分析问题

用存储过程、定时器、触发器来解决数据分析问题

用存储过程、定时器、触发器来解决数据分析问题

要求:假如现在剩余 26 只pig,但是客户下订单买27只,能否预防,能否将buy_num > num 时,将buy_num 自动改为 num(深入理解before 和after的区别)

用存储过程、定时器、触发器来解决数据分析问题

用存储过程、定时器、触发器来解决数据分析问题

上面跟大家介绍了,如何数据分析工作中,应用 MySQL 的存储过程、定时器、触发器来实现自动化更新数据。当然,用 Python 或其他编程语言也能实现,个人认为在数据层面操作,更加简单、高效、稳定。具体还要看你当下的业务场景。希望通过本文能为你提供一个解决问题的思路。