90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

时间:2023-01-13 11:56:47

本文首发自微信公众号:HyperAI超神经

内容一览:ScienceAI 作为近两年的技术热点,引起了业界广泛关注和讨论。本文将围绕 ScienceAdvances 的一篇论文,介绍如何利用机器学习,对燃煤电厂的胺排放量进行预测。

关键词:AI for Science   化学工程   胺排放

国际能源署公布的报告显示,2021 年全球能源相关的CO2 排放量较 2020 年增长 6%,达到 363 亿吨,创历史新高。

其中 CO2 排放量增幅最大的是发电和供热行业,增幅超过 9 亿吨,占全球 CO2 排放量增幅的 46%。控制并减少发电及供热行业 CO2 排放量刻不容缓。

90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

2021 年各行业 CO2 排放量的年度变化

蓝色表示年度变化,红点表示净变化

查看 2021 全球 CO2 排放完整报告

碳捕捉:减少温室气体排放、实现变废为宝

在《中国电力行业碳达峰、碳中和的发展路径研究》中,行业专家给出了降低电力行业 CO2 排放量的三种改变措施:

1、大力发展风电、水电、核电等低碳电源,抛弃煤电、油电等高碳电源

2、对于燃煤电厂,用天然气、秸秆、生物质等低碳燃料,代替煤炭进行发电

3、利用碳捕捉技术,对燃煤电厂排放的 CO2 进行捕捉利用

其中,碳捕捉因为改造幅度小、想象空间大、具备变废为宝的能力,备受商业公司、能源公司以及电力行业科研院所的关注。

90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

电厂中的碳捕捉设备

碳捕捉是指利用 CO2 和胺类物质发生反应,捕捉电厂释放到大气中的 CO2 并进行压缩,封存至枯竭的油田、天然气领域,或其他安全的地下场所,供后续石油开采、冶炼、汽车等产业利用。

然而,CO2 在与胺类物质发生反应的过程中,也会产生危害公共健康和生态系统的胺排放,有效监控并预测不同电厂的胺排放,成为碳捕捉的一大难点。

近日,由洛桑联邦理工学院和赫瑞瓦特大学组成的研究小组,开发出了一种机器学习方法,可依据电厂过往数据,更准确地预测碳捕捉过程中胺类有害气体的排放量。目前该论文已发表在 ScienceAdvances 上。

90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

完整论文

论文详解:用机器学习技术解决化学问题

1、先导工场试验

碳捕捉工场非常复杂,因为过程模型 (process model) 通常侧重于捕捉 steady-state 运行。然而,当前和未来发电厂的设计和运行,需要考虑到可再生能源发电份额的增加,这种增加是间歇性的、不规律的,因此还需要考虑到 steady-state 之外运行的动态和多变量行为。

为了模拟未来电厂运行的间歇性,科研人员对德国 Niederaußem 发电厂先导工场 (pilot plant) 的捕获装置,进行了一系列压力测试,试图发现电厂间歇性运行与胺排放量的关系。

90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

Niederaußem 燃烧后碳捕捉先导工场的简化流程示意图

实验虽然积累了大量捕捉工场行为的数据,但无法利用这些数据定性预测未来的胺排放,因为除压力测试外,实验过程中还存在另一变量--电厂专业人员的干预,以确保实验期间工场的安全运行。

2、获取数据集

先导工场实验中,科研人员每 5 分钟进行一次数据采集,积累了庞大的数据量,如何把这些数据转化成可供机器学习模型使用的数据集,成为研究重点。

科研人员的方法是把 time-dependent 过程及排放数据,表示成图像(数据矩阵),基于此创建预测模型,然后借助机器学习技术进行模式识别,预测胺排放。

在这种表示法中,工场在给定时间 t 定义了一个 state 特征向量 x(t),其中 p 元素表示过程变量(如烟气温度和水洗温度)。

取 t 个时间戳的工场 state 向量,得到一个 t × p 的矩阵。这个矩阵可以被看作是一个「图像」,与未来的排放曲线 y(t) 相连。

90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

数据表示示意图

本实验中用到的数据可以看作一张「图像」,其中:

宽度=输入序列 (T) 的长度

高度=参数数量 p

颜色=参数 xj 在某个时间 ti 的值

接下来,将工场历史图像中的 pattern,与特定的未来排放进行联系。为此,科研人员采用了梯度增强的决策树模型,将描述不同参数和排放量的行 (row) 合并为一个长向量。用分位数损失 (quantile loss) 训练模型,以获得不确定性评估 (uncertainty estimate)。

评估不确定性时,科研人员采用了支持蒙特卡洛 dropout 的时间卷积神经网络 (temporal convolutional neural network) ,并在 note S8 中展示用这个模型获得的结果。

有了这个数据集,就可以借助数据科学方法,开发一个机器学习模型进行数据分析。

3、从机器学习中洞悉胺排放

接下来,就可以用机器学习模型进行以下预测:

1、未来排放量(实时):基于历史 & 当前的运行和排放,预测未来 x 小时的排放量是多少

2、数据的 Causal impact 分析:测量特定压力测试对胺排放的影响,需要一个 baseline,提供在没有压力测试情况下的胺排放

3、减少胺排放:用模型预测「假设」情况下的排放量,如降低水洗温度是否会对排放量产生影响

90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

利用机器学习模型预测

未来 2 分钟、1 小时、2 小时的胺排放量

90 后学霸博士,深耕化学 8 年

本篇论文由洛桑联邦理工学院基础科学学院的 Berend Smit 教授和苏格兰赫瑞瓦特大学碳解决方案研究中心教授 Susana Garcia 共同领导的科研小组发布。

其中,开发机器学习方法,将胺排放问题转化为模式识别问题的学生,正是 Smit 教授小组的 90 后博士生 Kevin Maik Jablonka。

90 后学霸博士 8 年进击战:用机器学习为化工研究叠 BUFF

该论文的一作 Kevin Maik Jablonka

Kevin 本科就读于德国慕尼黑工业大学化学专业,2017 年本科毕业后,Kevin 进入瑞士洛桑联邦理工学院继续硕士和博士学习,在化学领域继续深造。

从 2014 年至 2022 年,Kevin 用了 8 年时间建立了对化学及化学工程的深刻理解,期间还通过对应用数据科学、机器学习的学习,将化学研究与人工智能进行融合,提升了化学工程领域研究的效率和准确度,是一位妥妥的 90 后学霸。

诚如多位化学领域的资深人士所说,机器学习在化学及过程工程 (process engineering) 领域,可能产生比计算机视觉领域更大的影响。

在 CV 应用场景中,模型学习的图像基本特征,往往与人类大脑感知图像的方式密切相关,如目标检测、人脸识别。

然而在工业场景中,人类往往缺乏对基本机制的了解,但通过机器学习,科研人员发现了从参数到目标观察物映射的基本规则,并对迄今无法预测的现象进行了预测。

在预测电厂胺排放这一案例中,机器学习超越传统方法,被认为是提供了一种观察复杂化学过程的全新视角,极有可能彻底改变未来燃煤电厂的运行方式。

人工智能将更多地应用于基础科学研究,为其提供动力、提升效率、加速科研成果落地。你如何看待 AI for Science 下半场的发展?它将带来哪些突破,又会面临怎样的挑战?欢迎留言分享你的观点和看法~