2018年1月13日,由极客邦科技InfoQ中国主办的AICon全球人工智能与机器学习技术大会在北京国际会议中心召开。此次大会以“助力人工智能落地”为主题,汇聚了国内外知名企业和顶尖人工智能专家,分享落地案例、探讨技术实践,为参会嘉宾提供了选型方案,提前预估相关风险和收益,助推技术落地行业。
来自北京天泽智云科技有限公司的CTO刘宗长分享了《云计算、边缘计算、CPS与工业智能》的主题演讲。
刘宗长从工业智能的定义展开演讲。未来的智能工业系统,能实现无忧的工业环境。要达到这个目标需要做到以下三点:
第一、不断提升工业的价值,用公式:质量÷成本×客户价值表示,即用最小的成本生产出最高质量的产品;
第二、让隐性问题显性化,从原来被动式解决问题变成预防和避免问题,实现三个零:零意外停机、零缺陷、零浪费;
第三、让工业知识*化,通过数据挖掘和建模,让知识不仅仅服务于某一个企业,而是以一种方式在不同企业当中流转。
如何将工业智能落地?刘宗长提出了“ABCDE+O” 技术体系 – A代表建模分析技术,B代表商业分析技术,C代表赛博平台技术,D代表数据管理技术,E代表工程技术,O代表运营技术,这一庞大的技术体系将计算机科学、智能建模分析与工业领域知识有效地融合,是工业智能真正落地的全面支撑。
天泽智云首席顾问,美国NSF智能维护系统中心主任李杰教授提出,无论是人工智能还是深度学习或者任何一种技术,当进入工业领域时,都必须满足3S的条件:
Standard(标准化):即如何与现有工业系统的标准化体系相结合,包括方法论、建模过程、数据质量、模型评价、容错机制、基于预测的操作规程、不确定性管理等各方面的标准化。如果不能够和现在已有标准相互去融合,则很难真正将技术融入工业,更无从去产生价值。
Systematic(体系化):在技术层级和应用层级方面的体系化,需要建立一套协同体系,明确智能化在部件级、设备级、系统级和社区级等不同层级中的任务边界及相互的接口。我们在工业里面发现无论是离散型制造还是流程型制造,单点突破很难做到价值提升,一定是整体系统导入才能实现。
Sustainable(稳定可持续):与人工智能预测的可解释性和结果的确定性相似,工业智能要能够做到同一组数据和同一个模型,不同的人来训练得到的结果都一样,否则怎么做到制造系统的标准化和一致性管理呢?神经网络也好,深度学习也好,如果它的结果不可复现,就很难融入到体系里面去。
因此,人工智能技术进入工业领域,应当是融入的方式,而非颠覆者的姿态。
之后刘宗长通过分享天泽智云在风电领域的实践案例,为在场嘉宾深入浅出地讲解了如何将计算机科学、智能建模分析与工业领域知识有效地融合,为风电产业实现智能化的价值提升。
中国风电行业在过去10年中蓬勃发展,然而风电产业的成本高昂,尤其运维成本和管理成本占了非常大的比例。针对这一挑战,天泽智云自主研发了WindInsight风场智能运维系统,对风场运营进行精准预测与管理、对风机进行健康管理、对运维策略进行优化,这些都为风机智能化应用和风场的智能化升级提供了很大的机会空间。
实体空间中的对象是风机和风场,基于风机运行产生的各类数据进行分析,可以对关键部件健康状态和风机的发电性能进行对称建模,这样就在赛博空间里建立了风机的镜像模型。基于风机的运行状态进行维护策略优化时,可以结合对未来三天内每台风机的预测发电量等信息制定成本最优的排程决策,还可以结合发电量预测给电网调度提供更好的决策。
赛博空间里这些模型是哪里来的呢?针对风电应用中常用的场景,比如怎么预测叶片结冰,怎么预测叶片断裂和破损等等,用户可以在GenPro这样的工业智能分析建模平台中结合自己的历史数据完成建模,并且部署到前面的生产环节当中去。接下来我们分别从生产管理、健康管理和运维管理三个方面介绍人工智能如何发挥价值。
风机发电性能分析
即便风场中的每台风机都在运行,但运行效率可能是不一样的,该如何更合理地评价呢?风电效率最大的问题是对标方式怎么评价,受地形、季节和天气等因素的影响,当这些因素不在同一个状态时,很难进行合理量化。
这里可以引入精益中的对标理念,将个体与历史最优实践做对标。如某一台风机随着时间,功率曲线发生了偏移,我们就知道什么时间点损失的功率最大;另外,同一个风场,同一个时间点,一台风机与其他风机集群做比较。对发电性能进行建模之后,就可以用标准的风速曲线输入到所有风机里面,从风场视角能够找到哪些是状态好的风机,哪些是状态不好的风机,进而做优先级排序,或者电网里面做功率分配,是非常好的参考。
故障的预测性诊断
影响一台风机状态的维度非常多,而且不同的信号对应的故障模式和部件也不一样。一个很大的问题是很难对这些数据贴标签,大部分情况下都是非监督式的学习。
面向风机健康状态的建模方法,我们采用了非监督式的模式识别算法。比如,一台风机,我们只知道它什么时间是正常的,用模式识别方法把正常模式记录下来。接下来的数据都与正常模式进行比对,判断它的偏移。在模式识别过程当中,我们采用了自组织映射图(SOM),对几十个维度特征进行降维,映射到相对低维环境当中。
建立了这样的模型之后,实时监测数据与之对比,通过它们之间的差异性来判断现在的状态和健康状态差异有多大,以及哪个特征贡献度最明显。
具体讲一个场景 - 传动链的振动分析。风机传动链里面有很多振动信号,通常会被传回到专业的振动分析师服务团队,分析师再去判断这些频谱里面是否存在故障。
这里的问题是,几千台风机只有几十个分析师帮助管理状态。所以,每出一次诊断报告,周期大概需要一个月时间。振动分析师是知识以人作为载体非常典型的例子。人去做分析的效率比较低,导致每一次分析的成本和周期也相对高一些。
我们探索的方法是,把这个分析过程中使用的信号处理和特征工程算法用一个分析流程记录下来,再用机器学习算法对这些分析师用来判断传动链状态的特征进行建模,从而代替人对振动信号进行初步的分析,对于疑似故障的振动文件,再将故障状态推荐和判据信息发给振动分析师进行确诊。
从一个振动文件中会抽取200多个健康特征,这些特征会根据运行工况呈现不同的分布状态,我们对一个风场里面上百台风机的数十万个振动文件中进行了特征挖掘,找到里面绝大多数风机特征分布状态的模式,这样就形成了一个全局的基线。接下来把每一个风机的状态特征跟训练好的基线进行对比,做差异性判断。
图中颜色越鲜亮的地方,表示差异性越强,也就是这台风机的状态与集群的差异性越明显。之后对差异贡献度进行分析,做故障进行定位,对背后所对应的振动文件进行分析,就能找到相应的故障模式。
这样的过程基本上能够实现实时的分析,并且可以把初步的诊断结果和判据推送给振动分析师,进行最后的确诊,这个过程就把效率提升了很多。
运维排程的优化
知道了哪些设备出现了早期故障,接下来该在什么时间点把故障排除,用什么样的排程计划,使成本降到最低?成本有很多构成来源,包括交通、人力资源成本、维护的基础设施工具等等,最重要的一点是,维护的风机需要停机,所造成的发电损失如何控制。最理想的方式是在风速比较小的时候维护,风速比较高的时候保持发电。所以运维排程需要考虑的因素非常多。
以外卖骑手调度过程做一个类比。饿了么的外卖骑手调度,比如同样一个订单,几十个骑手都是备选人群,先预测送单时间,基于预测结果,在一个优化的框架里面进行优化,然后再迭代,在很多很多种可能性里面去寻找最优的可能。
对于我们风场排程也是一个道理。需要排程的有十几个维护任务,该让谁做什么任务,在什么时间点去做,这里面也有非常多的优化空间。这其中我们最注重的是优化性能。举个例子,一个风场仅仅做20个维护任务,需要对应两艘船和三个维护小组,这背后的成本可能就已经达到上亿。
最初我们选择动态规划的方式,包括基于像CPLEX或Gurobi的商用求解软件,但是发现它的性能非常差,大概求解完一次的排程达到最优结果要20小时左右。后来又尝试了其他机器学习方法,比如像遗传算法、粒子群等等,发现求解时间从几十个小时变成十几分钟,但客户体验仍然不够好,我们希望做到1分钟以内。
因此,我们做了多层的遗传算法,它的框架根本而言是基于对决策流程的拆解。第一个层次里对最优维护顺序进行排程,先不考虑时间窗,只考虑先后顺序,先后顺序搜索到最优情况后,再判断这个顺序里面最优时间窗是什么,比如一个任务和另一个任务的最优间隔是什么。如此,就比单层的遗传算法的效率提升了几十倍。
看一个真实的案例效果,对17组不同维护任务进行排程,如果用Gurobi优化引擎求解时间大于20小时,用多层遗传算法的方法求解时间约50-70秒。优化前完成全部任务需要20个小时,成本是5万多元;优化之后,无论是完成的时间还是总成本,都减少了30%以上。
这个过程里能够发现,在获取到跟设备状态相关洞察之后,如何给它最好的决策,以此形成了洞察到决策到执行的完整闭环。只有形成了这样真正的闭环,才能不断迭代提升工业当中的价值。
海阔凭鱼跃:记一场工业场景下的AI技术实践
来源 | AI前线
作者|朱武
编辑|Emily
导读:相比如火如荼的消费级人工智能,AI 技术在工业和制造业的发展与落地却显得不温不火。工业智能虽隶属于弱人工智能,但在某种程度上,其高度的「自治性」与「独立性」应被施以更多关注。例如,工业机器人通常被设计用来执行特定的细分任务,而现代机器人则被授予了新的使命:做出实时决策。
在采访今天的主角——天泽智云首席架构师朱武 前,工业智能、虚拟智能体、工业互联网等概念彷佛如盘根错节般难以被释清,这同时也反映了工业智能背后的技术发展成为我们关注的空白区之一。于是,带着对工业场景的机理、工业智能背后的数据提取、建模、训练等技术挑战、智能决策系统技术架构的疑问,我们开启了这次好奇心之旅。
开篇:为工业智能正义
还记得在《机器之心》中,作者雷•库兹韦尔阐述了一幕大胆的预测:未来的世界,人类和机器将难分彼此,人类将不再是万物之灵。
如果将人工智能应用看作最终呈现的产品,那么决定“产品质量”各项要素的五个方面则形成工业智能的五要素模型——“人机料法环”。在旧有理解中,人作为活动第一驱动力而存在,与其他四要素并不同属一个范畴内。但在工业智能实施的情况下,生产组织方式发生了变化:
朱武解释说:“在这个模型中,活动作为一个虚拟的智能体,人在活动中的重要性弱化,活动的第一驱动力来自于反应活动的数据(知识)。这是智能在工业上应用所带来的最大变化和意义所在。”虽然从目前技术发展角度来说,绝大多数工业场景应用还达不到这种完全虚拟、完全智能的程度,但朱武强调,生产组织方式变化对应着智能应用方向的革新,从而直接影响了分析、创建系统的方法和流程。
而说到这里,我们并非想强调假大空的概念。定义工业场景的机理对于构建活动虚拟智能实体具有非常重要的基础作用。
可以看到,国内目前并不乏为工业领域提供 AI 解决方案的企业,林林总总包含了大数据公司、云计算厂商等同胞,但可能多半并不能清晰地定义工业场景的问题域,或很难从特定知识和数据维度进行工业场景分析。
比如用户需要对生产线进行优化,那就需要对具体产线进行分析,影响产线的主要是设备问题、工艺问题、还是人员问题?这是界定问题域的过程;再比如确定了问题是预测齿轮箱的故障,那就需要知道齿轮箱的构造、运转方式及工况,故障模式和相应的故障现象,这是为分析问题所涉及的实体对象的领域知识。
总结来说,工业场景的机理定义需要依赖于合理层次和颗粒度的问题定义,获得相关性的数据集,最终形成问题到数据集再到特征的映射。
但同时,目前的工业智能还处在初级阶段,大部分场景下还做不到完全智能化,但只要具备活动优化、自适应等特点的系统,都可以属于工业智能应用的范畴。
黄沙百战穿金甲——工业智能实现背后的技术挑战
问题域的确定和分析方法等众多环节的联结,会导致工业智能实现上所面临的技术挑战或远高于消费级人工智能所对应的难题。
例如,在 2015 年通用电气(General Electric)推出 GE Digital 时,GE Digital 的 CTO Harel Kodesh 就提出过:工业数据不准确、工业智能对风险控制和响应能力的高要求、终端处理能力的限制、复杂模型必须被解释等显示了工业智能与消费人工智能的重要区别,这也导致了在数据、算法和模型训练上工业智能所要开辟的一些「新领域」。
在采访中,朱武为我们解释了数据特征提取、建模等层面的技术挑战:
工业数据的多源性、复杂性和动态性强,比如柴油机气缸排气温度,取决于燃油、燃烧、进气温度、封闭性等等,因此,特征提取要求在高背景噪声下必须实现准确且快速的降维。另外,在数据建模及训练层面,工业应用的碎片化、个性化以及结果的专业性,需要建模及训练在整体和个体、通用性和个性化之间取得均衡。
那么,实现人工智能所依赖的关键技术多如牛毛,数据感知、大数据、机器学习、自动控制、仿真等该怎样地更好应用在工业智能中呢?朱武认为,从工程实现的角度,工业智能实现的关键有如下几步:
定义工业场景:正如上文所提及,问题域所涉及工业场景定义的准确性和完备性决定了该问题在多大程度上被解决的可能性;
数据的完备性和质量:工业现场数据一般带有很多噪声,而数据范围和质量决定了后续处理的难易程度和最终结果的准确性;
智能应用支撑环境:工业智能应用本身就具备碎片化、个性化、专业化的特点,如何提供快速有效的应用实施环境,包括数据环境、模型研发实验环境、应用部署环境等,决定了工业智能应用的推广和客户接受速度。
美国早在 2006 年提出了 Cyber-Physical System(CPS), 也就是“信息 - 物理系统”的概念,并将此项技术体系作为新一代技术革命的突破点。
依照美国 NSF 智能维护系统中心创始主任李杰教授、天泽智云 CTO 刘宗长共同发表的《工业大数据:挖掘“不可见世界”中的价值》一文中的阐述,CPS 是一个具有清晰架构和使用流程的技术体系,针对工业大数据的特点和分析要求所构拟的技术体系,其能够实现对数据进行收集、汇总、解析、排序、分析等全套处理流程,实现对工业数据进行流水线式的实时分析能力,并在分析过程中充分考虑机理逻辑、流程关系、活动目标、商业活动等特征和要求。因此可作为工业大数据分析中的智能化体系的核心。
CPS 的 5C 架构
于是,智能决策系统孕育了
在朱武看来,虽然 CPS 带有仿真环境的属性,但其很大程度上具备了智能性,“在工业场景下,很多细节需要机器或系统具备自动学习与调整的能力”。此外,CPS 内含协作概念,是实体虚拟空间的映射,并且使得实体设备与虚拟设备之间形成关联性和相互影响——朱武称之为自协作。
而工业智能机理的特定性、工业智能应用实施速度的提升(避免算法选型、数据诊断处理的大量耗时)以及标准化其实施和方法的需求,使得智能决策系统的研发和上线成为必要,天泽智云工业智能决策系统的诞生也是基于这样的背景:
为将工业领域知识模板化:朱武强调,工业智能的决策分析比较依赖于工业相关的领域知识、计算机科学和智能建模技术,但同时具备这三个方向知识的人员较少,于是将工业领域知识模板化将成为必然,从而降低实施工业智能的难度;
缩短工业智能应用研发和部署的周期:工业智能应用讲究快速反应的能力,实施速度的提升,如果在一套系统中像算法、软件实施、系统实施这类的技术层可以公用,那么可以大大缩减开发时长。
因而天泽智云就让智能决策系统提供数据接入、数据存储、模型发布和应用发布的功能支持,基本分离计算机科学和数据科学,从而数据科学家可以专注模型开发;
支持构建标准化的解决方案:朱武分析说,目前对于不同行业有定制化需求的不同企业,由于数据环境、数据质量及业务应用的复杂程度不同,从定义模型到应用的部署实施是需要 2-3 个月的周期,遇到新的应用场景则会耗费 3-4 个月。工业场景的不确定性太多,因而在智能决策系统中设定支持相关方法如特征提取、数据处理、场景定义等实施显得十分必要,一个标准化的实施方法和解决方案可以推动整个行业的发展,从而摆脱工业智能初级阶段「独乐乐」的窘境。
目前,CPS 的 5C(智能感知层、信息挖掘层、网络层、认知层和配置执行层)在智能决策系统中有这些对应实现:
对于智能感知层:智能决策系统通过边缘计算端点支持现场数据的接入;
对于信息挖掘层:支持任务化的数据迁移,支持各种数据源的动态接入和挂载;
对于网络层:提供基于实体语义的数据访问;
对于认知层:支持算法和模型的测试、试运行和发布;
对于配置层:支持各种业务服务的集成。
但同时,朱武也坦言,受制于现阶段国内工业智能发展的局限性及各场景间的零碎性,再加上 CPS 体系的复杂性,目前的智能决策系统都不能称之为 CPS 的全部实现。
智能决策系统如何用技术实现智能决策?
由于受工业环境不同种使用场景的约束,天泽智云会根据部署环境和业务场景的不同采用差异化的技术实施手段,因而,智能决策系统的技术架构也需要根据特定情境来调整。下图是天泽智云智能决策系统顶层功能架构图的全貌:
天泽智云智能决策系统功能架构
从功能架构图中可以看到,智能决策系统分成了数据分析与设计、计算环境、CPS 协作集成引擎、服务环境、数据接入、数据持久化及业务应用 APP 等多个模块。
朱武补充道,抛开功能架构不谈,智能决策系统的技术架构设计需重点考量三点:
关注技术的可替代性。因为新技术的不断迭代、专为工业场景定制的 IT 通用解决方案的缺失以及各家使用技术栈的不同,决定了架构设计上不应做到高技术耦合性。
实现 CPS 概念的映射。从数据组织、服务组织层面上看,朱武认为应使整体的决策系统体现出动态协同或自组织概念。
将计算环境与服务拆开。朱武解释,拆开的原因是想体现两种不同性质服务的概念。一般的服务环境并发性是横向扩展的,但计算环境中的服务执行在扩展性和并发性上体现的策略不同,另外再加上算法间的强依赖性,因而导致必须将计算环境与服务环境区隔开来。以实现风场风功率预测功能为例,其实现如下图所示:
整个结构分为对外的基于功能切面的服务与内部基于虚拟实体资源组织实现。在外部请求时,首先通过 API 网关,基于服务注册与发现,查询与定位服务,当风功率预测服务未启动时,服务注册与发现通知服务调度,服务调度创建并启动风功率预测服务。风功率预测将具体功能,如风场总输出功率预测、单风机输出功率预测等,请求各自的虚拟实体资源。虚拟实体资源,可以视为具备对外提供数据能力的虚拟化设备,该虚拟设备从逻辑上组织相应的数据接入、基于数据持久化的数据集、相应的计算任务,同时,可按照用户定义的策略,结合数据接入的实时状态数据,自动执行、管理其行为。
智能决策系统中的高并发和高可用问题
工业场景中,数据质量、数据全面性和数据精准性问题是很多企业的「烫手山芋」,“利用数据建模的手段解决某一问题时,需要获取与被分析对象相关的全面参数”,这也使得智能决策系统的计算环境一环需要面临高并发和高可用的挑战。
当然,需要澄清的一点是,这里指的高并发和高可用与传统意义上的意思有所区分。按照朱武的解释,工业智能的运行场景一旦场景明确化之后,并发量的大小是可以提前预知且明确的,所以高并发的严格指代是——考虑在不同业务场景下不同的负载该如何设置,如何优化调度策略和服务组织,使得单个应用实例跑的更好,从而解决资源的高效利用。
同样,高可用通常指通过设计减少系统不能提供服务的时间。但工业智能计算环境中由于算法装载等问题,导致无法全然断定服务出错的时间,或实现对服务有效性的精准判断。
工业场景,解决高并发问题实质是提升效率,而提高效率的关键点之一即实现数据的内聚性。 智能决策系统除了常见的设计策略外,根据工业场景的特点,朱武团队采用了数据区块化的设计方式:
工业智能应用一般是按照实体对象去采集、存储和访问数据,因此数据具备局部化特性。
朱武解释说,对于采集数据,通常情况下是在用分布式缓存 Redis 前用哈希映射到某一数据节点,并且最好使可执行节点和数据在同一个本机上,实现同样的机制映射,同时再设置相对合适时间阈值,这样就可以做到更好的分配。
另外,还可通过资源抽象的方式解决高可用问题,即让运行资源和运行实体分离来,动态按照需求调配运行资源。
该环节实际上可理解为计算节点重复利用问题,尽量让计算节点按照实际需求而分布。例如,请求接入后可从资源管理中获得资源空闲结果,采用调度策略找到相对应的节点,从而直接与计算节点建立关联。执行过程中,还可通过服务监控和灵活调度及时发现问题。
因此,在智能决策系统中,计算环境作为提供算法、模型的管理、运行和调度平台,(从业务场景来看)需要具备如下特性:
算法、模型依赖于不同的运行环境和组件包,集成时的形式存在多种形式,因此 计算环境需具备不同编程语言与框架的算法、模型集成能力;
计算环境应采用特定的算法、模型状态管理机制,用于服务治理。 对一部分算法、模型的执行,不太适用时间阈值的方式;
算法、模型执行效率,涉及算法、模型间的数据共享和协作,以及算法、模型内部中间结果的传递策略;
计算环境需要部署在不同的运行环境中,要求 计算环境能够根据实际需求伸缩和选择性部署的能力。
数据接入实现了现场数据、系统边界外数据接入系统的能力,根据工业数据应用的特点,数据接入需要具备如下特性:
多种协议集成和采集策略的实施:IoT 在接入数据层会有各种各样的协议,因此需要将不同的协议进行集成。另外就是采集策略也是千变万化,但要想推进标准化和品牌化就会使得很多采集策略失效,因而目前的解决方案也只能靠人工解决。
多种时效性数据的双向传输: 在天泽智云目前的业务场景中,有上传和下传两种时效性传输。上传涉及到状态数据、振动产生的文件或数据集等,下传数据包括指令数据和更新。
错峰控制: 在上传和下传实时数据时,可能会遇到数据积累和堵塞情况。底层传输机制的实现在部分 IoT 组件上并未最大程度上优化实时性。因此,业界有用到组态软件来解决该类问题的方案。但组态本身来讲是组织态势,组态软件是指可配置、可调整的软件系统,并不指实时性。所以数据接入的时候,很容易会面临 物理上同一个链路的竞争,所以需要适当控制。
此外,数据接入还面临到不稳定状态下的数据可靠传输、数据预处理(包括质量过滤)、实体信息和背景信息融合等多维度的技术挑战。
以智能风场的能量管理系统为例,其需要的数据接入如下图:
从上图可以看出,其数据来源、数据链路、数据通信协议及时效性、安全性约束的多样性。目前,天泽智云是软硬结合来解决和完成数据接入的问题。通过边缘计算、工业物联网网关、PLC/SCADA 这些硬件设施解决部分接入,在软件层面通过通信代理、总线技术解决另一部分数据接入。总的来说,还是亟需行业和政策的共同推动,从根源上统一技术栈,实现智能接入的真正落地。
如何将人才真正「适配」到工业智能中
在采访过程中,朱武与我们多次谈到了工业场景机理的特殊性和差异性,二者决定着工业智能的推动不仅需要从业人才具备数据、算法等技术技能,同时还要面对着各种工业领域新知识的「侵袭」。这就对挑选合适人才、使新晋成员更快获得成长等方面提出了更多挑战。
朱武重点阐述了他们的三点培养方法:
一是给予成员清晰的定位,规划、设定其所处的技术维度,在技术上为其划分精确的方向和专业,与其共同谋划好职业成长路线;朱武团队内部目前没有采用一带一的传统成长计划,而是通常分三人小组,分配任务时以团队为单位进行,从而促进其小组内部的技术交流氛围,让每个人获得更快的成长速度。
二是强调技术分享和轮岗制。朱武团队很鼓励在某一个技术领域有了一定积淀后,为获得更充分的应用和解决方法而参与到另一个技术领域的构建中,从而实现技术上的*转换。
三是充分信任,做到合理的任务分配。工业智能没有更多的捷径和投机取巧的方式实现落地,无论在技术层的突围还是人才层的吸纳,脚踏实地是关键。这也是采访中朱武不断强调懂工业机理重要性。
采访嘉宾介绍
朱武,天泽智云首席架构师,承担过多项国家重点型号科研项目,擅长工业领域的软件系统开发、测试和架构设计。曾就职于中国船舶系统工程研究院,主导并实施海军后勤装备保障体系信息化建设;作为总架构师与 IMS 共同合作,参与船舶智能运行与维护(SOMS)系统等多个智能化系统的架构设计和实施。
让工业智能接地气的那些事儿
提到工业智能,总绕不开“大数据”、“云计算”、“人工智能”这样几个关键词。其实还有一个关键词也非常重要,它能够将上述几个关键词穿连起来,让工业智能可以真正实现落地。这个词,就是“边缘计算”。
而这一切的起源都是大数据,我们先来看看工业大数据这件事。
大数据
提起大数据,不禁想起多年前的一个梗:
好吧,这是插播的一个笑话。
现在大数据已经深入人心,而且也有了非常多的应用。据传,当下非常流行的手游“某某农药”就是用大数据的方式设计,它所具备的降维打击的精准性和力量已足以让人震撼。
大数据本质上是一个现象。在工业环境里大数据的“大”,甚至超乎想象:波音飞机每个发动机每秒钟产生的数据多达5G,一辆电动汽车每天会产生4000G数据。
如此之大的数据量,是其他大数据场景所难以想象的。为了解决这种现象所带来的种种问题,云计算、边缘计算、人工智能等新兴技术纷纷兴起。
云计算是处理大数据的传统方法,它使用超强的计算能力来分析海量的数据。带着这种思路过渡到工业大数据场景,我们首先想到的就是把所有数据都上云,借助强大的云来处理工业数据。
边缘计算则是另外一种处理方法。与云计算不同,边缘计算似乎是反其道而行之。云计算强调的是数据和计算的集中,从而实现随时随地访问、读取数据;而边缘计算强调的是将计算分散,在数据产生端直接进行处理,实现分布式计算。
也许大家觉得边缘计算还有些“边缘”,但其实早在云计算兴起之时,就已经有人针对其缺点提出了“雾计算”,意指将计算沉浸在数据中间;此外还有爱开玩笑的人提出了“霾计算”,估计是个北京爷们儿。其实人们之前常说的“雾计算”就是边缘计算。
在互联网上关于云计算和边缘计算的争论很是激烈,甚至还有人说边缘计算终将取代云计算。我觉得“取代”的可能性应该很小,但是两者之间的争议应该还会继续。
这里我们需要先停下来,不参与两者之间的争论,分析一下为什么工业场景会有这么海量的数据?我们怎么更好的处理这些数据?
工业大数据
工业数据的来源:
工业数据和日常的数据不同,日常的大数据来源于用户的每一次交互,每一次搜索的关键词、每一次共享单车的开锁等都会产生相应的数据,而这些原始数据本身就具有意义。
工业数据来自于传感器,以高速进行采集。以轴承为例,采集轴承的震动信号,需要20kS/s 以上或者50kS/s以上的采样率进行连续采集。然而,这些原始数据本身并没有直接的意义,需要经过频谱的分析、包络检波等过程,才可以提取出有价值的信息。分析的过程,需要多个同步采集的传感器采集上来的数据协同运算来完成。
数据量如此之大,就导致把数据完全上传到云之后再做处理的方式变得非常不现实,同时也不是最理想的数据处理方式。究其原因主要有以下三点:首先,如此海量的数据上传需要巨大的带宽资源,从传输成本上来看是非常庞大的一笔开销。其次,数据上传的过程会有很多的不稳定性,从数据上传到计算得出结果会有很大的延迟,并且这个延迟也有不确定性。最后,我们需要明确的是:数据本身并没有价值,有价值的是将数据处理后得到的信息。每处理一次信息,最终获得的价值就提升一次。
但是数据价值的时间曲线是衰退的,也就是说,随着数据获取时间的推移,其价值也在衰退,越早处理价值越高。比如在获取数据后的1秒内就告诉我未来一个星期设备出故障的概率会超过95%,它的价值远高于一个星期之后才告诉我设备出故障的概率是95%。因此我们需要尽可能早的处理数据。
基于这种观点,我们需要将尽可能多的计算放在边缘端进行。
那么现在回答第二个问题:我们怎么更好地处理这些数据呢?
对于传统的互联网大数据,其数据本身是发散的,我们分析的主要目的是找到数据之间的相关性,根据相关性信息就可以直接得到决策。最成功的例子就是广告推送,比如淘宝会根据你的浏览、购买记录,为你推荐相关的产品,它有时甚至比你自己更了解你的需求。
但是工业大数据的分析并不是这样,工业大数据需要从中挖掘更多的因果性,从而根据当前的状况判断可能的原因或者预知故障发生的概率。而了解更多行业相关知识、加深对设备机理的认识是找到这种因果性的关键。
人工智能
最热的词汇了,在金融、消费电子、制造业等等各个领域,人们都在如火如荼地讨论人工智能。我们需要注意的是,人工智能的目的不是为了摒弃我们原来积累的知识,而是在传统知识解决问题有难度的时候,使用机器学习和人工智能来获取帮助。
李杰教授提出的CPS架构中,有一个至关重要的元素M,就是建模(Modeling)。随着当前设备和系统越来越复杂,完全基于机理模型进行建模已变得非常困难,因此将传统学科的知识和机器学习相结合,借助人工智能手段来参与建模,就成为了一条非常可行的出路。
美国IMS中心在过去的17年中,通过众多的实践案例,一次又一次印证了这种方法的可行性与高效性。因此,结合机理模型的人工智能,才是实现工业智能的合理路径。
既然这些模型使用了大量的人工智能方法,那么这些模型是否都要部署在云上呢?
提到人工智能,我们或多或少地会惯性联想到云计算。云计算的确是实现人工智能的一种手段,但很多模型确实也可以部署在边缘端,而且在实际应用中也取得了非常卓越的效果。
阿尔斯通作为一个国际领先的轨道交通OEM厂商,很早的时候(2006年开始)就已经着手实践利用运行中产生的数据提供更好的服务。其中包含了大量的边缘计算系统的部署。例如Train Tracer、Track Tracer、Train Scanner等系统就可以在离开云的情况下解决90%的问题,这极大的释放了云端数据的存储和计算压力。
因此在边缘端实现人工智能的算法成为当前实现工业智能的重要的技术要素。
工业智能
人工智能已经成为了人们的共识,工业领域要实现智能化,也无法离开人工智能技术的应用。
为了实现工业智能,目前有很多公司已经从不同的方向出发尝试解决这个问题:ABB、Intel、霍尼韦尔等公司根据自己擅长的领域,从边缘计算端尝试实现工业智能、预测性维护;而微软、IBM、PTC等公司则从云和IoT架构的角度,尝试通过云计算来解决预测性维护的问题。
但是云计算和边缘计算各自有各自的优势,偏废一方都有可能对实现工业智能造成障碍,这是由于工业场景和架构下的大数据要比互联网大数据复杂的多。
对于工厂,我们可能需要从设备级别、车间级别和集团级别分别进行分析和管理,这不仅需要实时的结果反馈,也需要从不同维度、不同历史时间进行分析得到的结果。并且,很多场景也需要随时、随地获取结果,比如在办公室、在车间、或者在出差的路上对工厂进行管控。
不同的技术有不同的特长:边缘计算可以尽早地获取有价值的信息,而云计算可以针对更广阔的维度和时间尺度分析。因此我们需要借助云计算、边缘计算、人工智能等多种技术手段,在合适的地方做合适的数据处理。这样,才会达到工业智能最终想要的效果。
总结
总之,云计算是个好东西,但是对于工业智能这个场景,稍微有点力不从心,有些“高高在上”,不够“接地气”,在结合边缘计算的情况下,能够更大地满足工业智能的需求。
作者简介
陈 星
天泽智云IoT解决方案经理
本科和研究生毕业于哈尔滨工业大学,曾就职于美国国家仪器 (National Instruments),从事于嵌入式系统、硬件在环仿真(HIL)、自动化测试、FPGA等领域的技术应用。目前作为天泽智云IoT解决方案经理,参与高铁轨道交通、风力发电、机械制造等领域的项目。
从人工智能到工业智能,和工业智能化转型的三个路径
9月27-29日,以“构建中国制造2025新生态——精益·数字·智能”为主题的第十四届中国制造业国际论坛(MIF)在天津梅江会展中心举行。此次论坛由天津市工业和信息化委员会指导,制造业国际联盟、爱波瑞集团主办,现场有1500余位制造业领袖、专家、学者、政要以及快速成长型企业参会。北京天泽智云科技有限公司CTO刘宗长受邀出席并发表演讲。
大家好,今天这场分论坛的主题是“新一代工业智能——CPS与工业大数据实践”。那么,工业大数据、CPS、工业智能这些名词到底是什么?是如何定义的?我今天将为大家分享我们对这些热门技术词汇的理解,通过案例帮助大家理解工业智能的含义及其发挥的价值。
人 工 智 能
2016年人工智能悄然出现并逐渐发展,直到现在,仍处在一个人工智能序曲的阶段上。这是为什么呢?AlphaGo事件中人工智能首次战胜人类棋手,引发了许多思考;同时,越来越多的公司也开始把人工智能技术引向工业的应用。
· 柯洁在大战之前说,从AlphaGo当中我们学到了很多东西,这对整个人类认识新的知识有很大的益处。
· 上个月特斯拉首席执行官埃隆·马斯克(Elon Musk)联合100多位人工智能学者向联合国提出倡议,我们应该去关注人工智能给人类带来的威胁。
· 麦肯锡曾经指出:“可能到2035年的时候,我们一半的工作将被人工智能所取代。”
· GE前总裁Jeff Emmelt曾提出:“一觉醒来惊奇地发现,GE已经变成了一家互联网公司。”
· 德国Fraunhofer研究中心指出:“人工智能可以将生产率每年提高到0.8%-1.4%的功能。”
这些都预示着人工智能时代来临了。可是为什么我们需要人工智能?举个例子,在一辆汽车内设置了移动终端,实现对路面信息、交通状况、预计到达时间以及周围商圈等情况的信息收集,这样人们出行时能够享受更多的便利和更好的服务。可以看到,人工智能带来的并不是原本汽车的改变,而是用新的方式提供了更便利的信息服务。
工 业 智 能
在工业界也是如此,原本的设备没有改变,在机器端对数据进行采集与分析,会呈现出很多关于设备的洞察,包括目前的运行状态与健康程度,跟其他设备与历史状态进行比较,自主预测未来设备的状态。最终,这些信息汇集之后传输回设备端,实现自我的维护和调整,这正是智能化技术在工业界当中巨大的优势体现。
那么,目前工业中有哪些不足?如何运用人工智能来弥补?过去我们关注两个方面,第一个是可制造性,运用多种建模手段,如冲压制程等,通过对物理指标的仿真考察规格是否合格,但无论怎样仿真,有些问题还是难以被发现和关注,最终导致在仿真中优秀的模型,到实际生产中仍可能会产生次品。第二是生产系统设计,即对于设备综合效率(OEE)的管理和设计、及整个制造系统当中设计的管理,大多数企业会用到仿真软件,但无论怎样设计产线,都很难保持设备零意外停机的无间断运行。最主要的原因是设备都有一定的衰退,当衰退积累到一定程度会产生停机,进而生产线停止,最后导致过去的数据模型失效。
所以我们会发现,设计建模与实际的生产制造中间存在一个很大的差距,它们之间不匹配,这就会产生忧虑。在过去的生产线中,目标是实现work reduction(怎样减少工作)以及waste reduction (怎么减少浪费),现在worry reduction(零忧虑)成为新的目标,即怎么把生产过程中原本不可见的东西变得可见,从而去管理这些由于未知所造成的忧虑。将设备中所有造成停机、浪费、次品的风险全部加以控制,最终实现三个零:零停机、零次品、零浪费,消除生产过程中的忧虑。
美国IMS中心在2000年成立时,曾提出“未来智能工业系统”的概念。当时发现每个产品或者系统中都会有上百维的数据,但那时数据并不像现在这么容易提取出来。我们的想法是,基于嵌入式的智能终端,将分析方法进行有效的结合,用Watchdog Agent分析引擎,将信息在边缘端处理之后,传输出当前状态和健康相关信息,再跟运营系统相连接,最终通过可视化的服务传递回设备端,传递时间既不过早也不过晚(Just-in-time),从而实现近零停机(near-zero downtime),即任何一次停机都处在预料之中。如此可以对机器进行主动的维护,同时将信息反馈到从设计端到产品制造端的全过程中,实现对设备的改善,最终实现信息的闭环。这就是我们当初提出来的设想。
通过这个设想的发展,我们发现当初预见的未来正在变成现实。让我们聚焦到现代工业系统是怎样的?未来智能工业系统会怎样?主要表现在零部件级、设备级、生产系统这三个维度上。
从零部件级,现在关注的是精密性,以及如何通过更加精密的传感器,实现更加精密的动作,那么未来呢?需要具备自预测性和自省性,设备需要精密,但不会一直精密下去,外部原因或者自身衰退都会造成精密性发生变化,这时零部件可以将设备的状态以及能造成的后果反馈给操作者。
从装备的状态角度,现在关注的是性能,以及能否连续生产质量达标的产品。未来更加关注设备的自比较性,自比较性也是对标的概念,麦肯锡在数字化制造的战略当中,提出了这个概念,它既包括设备与自身历史最优状态的对标,也包括在不同的环境下,集群内与其他的设备之间的对标。这样可以清晰的了解设备目前状态好坏与否,如果设备状态不好,还可以进一步了解故障在哪发生,以及是哪种原因造成的。
第三个层面就是整个系统,怎样实现最大的生产性来提升设备综合效率(OEE)。现在我们主要关注的是系统中各个设备、工序之间怎样配合。配合的概念是指当上游产生了质量误差,及时发现并在下游进行补偿。在这个过程当中,如果有设备出现质量问题,能用其他的途径进行改善,这就实现了具有强韧性的系统(resilience system),即系统内部可以通过协同性的优化,把问题的影响降到最小。
以上讲的由零部件、装备到系统的不同层级的角度,为大家展示了未来我们希望的工业智能系统的状态。
工业智能发展的五个阶段
在实现工业智能的过程中,需要经历五个阶段。正如这场论坛的主题——精益、数字、智能,这六个字涵盖了制造系统从传统到智能化的演变过程。
第一个阶段,是过去大家一直在做的,即TPS全员生产系统的标准化持续改善,提升整体的生产文化的管理;
第二个阶段,是精益化和数字化。精益化和数字化的概念是以数据为驱动标准,使整个系统当中的配合性能够达到最大化,用数字化的方式把当前的状态实时地表示出来,这样就可以了解设备将会出现的问题以及可能带来的影响。
第三个阶段,在我们知道了当前状况的时候,如果能够通过预测性的手段,或者通过数据驱动建模的分析方式,寻找到问题产生的隐性原因,这就是将隐性问题显性化的阶段。要实现这一目标,需要基于大数据,或者人工智能的建模技术;
第四个阶段,当知道设备出现问题的原因时,可以通过结合具体场景,预测对设备的运营或决策会产生什么后果,来实现以预测性为基础的有效性运营和决策优化;
第五个阶段,在以上基础上,把感知、分析、优化和执行连接起来,实现在赛博空间管理整个实体空间中所有设备的系统,形成了赛博空间与实体空间的镜像,最终实现CPS的工业智能系统。
目前大多数企业还处在第三个阶段,前两个阶段做得很好,但建模的能力还没有形成,问题出现时不了解故障原因。
用GE倡导的工业互联网概念再来描绘一下未来工业智能的技术图景。这个圆圈包含了很多的技术,数据输出后,运用基于机器的算法(machine-based algorithms),如嵌入式智能和边缘计算的技术,以及在云端的智能分析、数据可视化等,运用数据产生最优化的决策,传递到不同的组织,最终反馈到设备当中进行执行。这既包括IT与OT之间的相结合,又包括很多的云计算、边缘计算等最新的IT技术,甚至包括像大数据分析,人工智能建模等最新的技术研究方向。实现智能设备、智能分析、智能决策,最终形成自发自动的循环。
工业智能化转型的三个路径
那么对于目前的工业企业,如何运用工业智能技术和大数据来实现转型?可以运用这个模型分成三条路径 - 对于问题,纵轴分为可以解决或是避免,横轴分为可见问题和不可见问题,过去致力于怎样解决可见的问题,并进行持续的改善和标准化。
那么接下来转型的第一条路径是怎样去避免不可见的问题:从数据的角度,将问题产生的过程用数据分析、建模,来了解发生的原因。并在发生的原因上,通过预测性方式持续改善,来避免可见问题的发生。
不可见的问题是指设备衰退或者生产过程中会出现残次品,设备背后的关联性和关系性模型存在的问题是不可见的,从数据的角度能够挖掘到关联性,把不可见问题变得可见,更加高效地解决问题,这是我们可以开发的第二条路径,会用到PHM、机器学习还有知识挖掘等核心技术。
第三个路径是建立知识的模型,把相关性挖掘出来后,变成知识进行沉淀。沉淀后在赛博空间建立对称管理,实体空间中所有装备镜像的模型,实时产生所需的最优决策,用到的核心方法是建模技术(Twin Model)、信息物理系统(CPS)等。
工业智能化案例
下面介绍几个案例,来帮助大家更加清晰地理解工业智能的这三个转型路径或方向是怎样完成的。
第一个案例是通过阿尔斯通的轨道交通智能管理系统来解析如何利用数据分析问题发生的过程,并且避免可见问题的发生。阿尔斯通是全球非常先进的轨道交通解决方案的供应商,不仅基础设施庞大而且维护费用也高,所以阿尔斯通2006年推出智能管理系统Health Hub,实现从车辆级到基础设施级的智能管理。在感知系统方面通过Train Tracer、Track Tracer、Train Scanner等产品,实现将运行过程当中的实时状态数据传递到HealthHub中进行分析,实时评估关键部件的健康状态,预测未来的风险,并且用预测性的方式进行排程优化。
这套系统支撑起了阿尔斯通向服务型制造的转型。目前阿尔斯通已经有超过35%的收入、50%的利润来源于对已经卖出设备的服务型管理。其中的价值在于,车辆卖给使用者之后,通过智能的分析、预测与优化排程,帮助用户节省维护成本,这是生产价值模式的转变。
整个系统运用了典型的CPS技术框架,包括设备中数据的智能连接,实时的数据分析流,云端实现建模过程,经过大数据分析之后,对这些问题预测和决策,最终将决策运用到所有的相关部门中。展示一些典型的界面,2010年IMS中心与阿尔斯通进行合作,提供了很多分析模型的核心算法,包括像高铁集群的监控、车辆内部的牵引系统、轴承系统、轨道的转辙器、车载的轨道监测系统等。在模型的底层上,将传统的不可见的问题显性化。
目前天泽智云也在跟国内某高铁制造商合作,开发基于CPS技术的高铁PHM(预诊断与健康管理)平台,通过对高铁进行大量的实验将关键部件的镜像模型建立出来,包括失效模式、失效的状态,以及过去探测到具有隐性失效特征的算法等等。
第二个案例是高圣智能带锯机床,通过从数据中挖掘隐性问题的线索,实现对不可见问题的管理。传统的不可见的问题,包括设备衰退、质量过程参数产生偏差等,如何进行预测和管理是在我们在制造系统当中最常见的问题。带锯机床通常用来做材料的粗切割,如将块状材料切割成不同的形状。锯带是一个耗材,如果在使用过程当中出现了断裂等问题,会造成质量参数的缺失,以及大量成本的增加。
传统的方式是通过有经验的操作工人,在现场用耳朵去听设备的声音,判断当前的锯带是否正常。如果觉得噪音变大,就更换锯带,有时可能把好的锯带换掉,造成成本浪费;也会出现没有及时发现问题而造成了锯带断裂,如果切削的是极其昂贵的航空材料时,这块材料可能就会报废,造成极大的成本浪费。
后来项目团队把人的经验和生产过程当中的参数固化为模型,来预测锯带的状态。通过试验传感器的部署,把知识、故障模式、切割参数等信息集成到模型里,同时运用PHM算法工具,包括信号处理、健康评估、故障预测等,实现了在不同的工况下,通过状态参数进行自动识别,提取不同健康状态下的特征聚类,再运用特征识别等模型方法判断当前的状况。
最终,实现了将锯带从完全健康到镀层磨损,再到内部实际的磨损,最后到断裂的整个过程中,把不同时期的模型建立起来,这样就把过去不可见的问题显性化。这些实时的数据,包括锯带的衰退状态,核心部件的运转模式等,通过模型加以分析,通过手机端或者web端进行访问,实时决策优化管理。过去可能一个人管理最多10台机床,现在一个人可以管理更多的机床,实现了从人员的使用效率到成本维护的整体优化。这个产品在2014年芝加哥国际制造技术展会(IMTS)上第一次展出,2016年正式商业化,目前已在全球部署了超过一百多家的项目工程。
第三个案例是通过智慧风场系统解析如何利用知识建模在赛博空间里面产生对实体的管理镜像,实现对不可见问题的避免。风场大多在相对偏远的地方且风机成本昂贵,这对生产管理、健康管理以及运维管理层面有很大的挑战。对于一台风机,生产管理方面要实现对设备衰退状态的监测,并预测当前的环境;健康管理方面,主要针对风机内部的核心部件的管理;运维管理方面,通过预测的方法实现对设备故障的避免以最大化降低运维成本。
通过研究发现,要把以上的忧虑解决掉,需要三个步骤。
第一步进行状态评估,即了解风机的实时状态,无论是性能的衰退或健康的风险,都要进行精确地量化。
第二步是场景化预测,比如整体维护排程的优化,采用不同的排程规划,会产生不同的生产和维护成本,结果也有所不同,因此需要将所有可能的成本结果都量化出来,从上亿种可能性中搜索最优的一个结果。
第三步是优化和避免,一台风机中可能有上百维的参数,运用模式识别的方法判断正常状态、非正常状态,这样可以清晰地识别出正常状态下的风机。当新的数据输入进来时,实时地跟正常模式进行比较,当发生逐渐偏离健康状态时,设备就会产生新的风险。
实现这一系统后,对大型的部件如传动链可以做到提前至少30天预测到潜在故障。当了解到设备的故障后,就要对故障进行排除。这涉及维护的问题,要考虑多成本要素的综合建模,包括机会成本、固定成本、动态成本,实现全部建模后,基于建模进行有效预测,比如在某一时刻,将有几十个排程的任务,不同排程组合造成的成本是多少,这可能有上亿种不同的组合途径,如何在这些途径中搜索最优的结果,我们运用了遗传算法的优化模型求解过程。遗传算法针对于风场排程的问题,实现了多层的优化求解器,比传统的线性规划提升上千倍的效率,比单层的遗传算法提升数十倍的效率。对于一个风场来讲,如果要排程几十个维护任务,可以在一分钟之内找到最优的结果。
目前这个WindInsight系统是我们与微软的Azure合作,实现部署的一个海上风场。风场在实时运行的时候,整个风场的风机运行状态是否有潜在的故障或者风险发生等,都可以在这个系统上进行远程判断。当某个风机出现潜在故障时,我们可以对它进行最优化的排程。优化排程中考虑的因素包括当前人员使用率,整个风场的风资源情况,风机的发电能力情况,故障衰退情况等。也对每台风机进行对标,与整个风场内的其他风机相比发电能力如何?与历史相比发电能力如何?在对风场管理时,对当前风场未来72小时的风资源进行预测,包括风向和风力的情况。在维护的过程当中,要尽量的选择风小的时候进行停机维护,在风大的时候进行发电,如此经过多成本的综合考虑后,产生新的智能优化的模型,对这些模型进行在线评估。这样的过程实现了对风场从设备的管理到生产管理再到维护管理的全栈式解决方案。
关于CPS信息物理系统
以上三个案例的实现,是基于融合了边缘计算和云计算的CPS技术架构。CPS这项技术在国外研究的人非常多,2011年GE第一次提出工业互联网的概念的时候,就提到CPS将会是未来的核心技术,而德国的工业4.0也提出CPPS的概念。在我国,CPS也是今年工信部推广的一项重要的技术架构,于3月1日正式发布了CPS信息物理系统白皮书,将CPS定义为支撑工业和信息化深度融合的一套综合技术体系,对于实现中国制造2025和推进我国工业产业的价值转型与升级具有重大的意义。
在李杰教授的《CPS新一代工业智能》书中,定义了CPS的5C技术体系架构,即Connection智能连接层、Conversion智能分析层、Cyber智能网络层、 Cognition智能认知层、Configuration智能配置与执行层,也被收录于工信部的CPS信息物理系统白皮书中。实现这五层的CPS架构,需要融合DT数据处理技术、AT分析软件技术、PT平台接口技术和OT运营技术,对工业大数据进行连接、挖掘、分析、预测和优化,将工业生产制造当中的知识转换成高价值生产力。
关于天泽智云
最后给大家介绍一下我们。IMS中心是美国自然基金会下属的一个产学研合作中心,过去在IMS中心时,我们主要的研究方向是设备的预诊断与健康管理(PHM),随着数据量越来越庞大,IMS的研究领域开始向工业智能和大数据分析方转移。我的导师是IMS中心的创始主任李杰教授,在他的《工业大数据》、《从大数据到智能制造》、《CPS新一代工业智能》、《云上工业智能》这四本书当中,对刚提到的概念有详细解读,并且列举了之前做过的30多个工业智能化的案例, 如果大家想要了解更多,可以翻阅书中得到更详尽的资料。
天泽智云是IMS中心在国内的技术孵化企业,定位是工业智能实践引领者。核心团队来自于IMS的机械工程博士,具备工业领域知识、计算机科学、人工智能算法的跨界知识与应用能力,拥有丰富的工业智能项目的实践经验。我们希望将IMS过去17年在工业智能方面的项目经验智慧在中国进行传承。
天泽智云工业资产智能运维解决方案以“信息-物理系统”(CPS)技术为构架,结合对工业场景的深度理解,为客户提供从方案的咨询到实施以及持续的能力交付的全栈工业智能方案集成。通过交付从产品到能力的赋能服务,真正地帮助客户提升整体竞争力,实现价值转型。
最后,欢迎大家关注天泽智云的官方微信,里面有很多工业智能化成功应用案例,以及工业智能相关的技术资讯,都可以供各位参考。谢谢大家!
天泽智云揭秘:人工智能如何打造“无忧风场”
2017年7月13日-14日,第三届风电场信息化智能化专题交流研讨会在北京召开,本次会议由中国电力企业联合科技开发服务中心与全国风力发电技术协作网联合主办,300多名风电行业专家、相关企业代表出席,旨在分享、传递国内外人工智能应用风电领域的最新进展,鼓励行业创新,加速风电领域工业智能化的进程。
北京天泽智云科技有限公司首席数据科学家史喆博士在会上介绍称,“如何应用人工智能为风场无忧运营保驾护航,是风电领域亟待突破的问题之一。”
从人工智能到工业智能
人工智能技术的发展经历了三次浪潮,近两年来又得到了突飞猛进的发展,部分原因是得益于资本市场的投入和大量的市场宣传,让大家相信这项技术可以解决很多问题。从市场上能看到很多互联网企业在向工业企业转型提供技术服务,但是怎样去结合,谁占主导地位,两股力量正在斗争;从技术成熟度角度看,这个领域仍处在探索阶段,不少人认为工业大数据有数据基础,与人工智能相结合就可以解决很多的问题,因为从海量数据当中很容易通过数据清洗和数据挖掘发现相关性。其实,工业领域真正需要挖掘的是因果性,以及因果性怎样去证明、怎样去利用才是核心难点。像这张图所展示的,销售的业绩和刮胡子的人数是有强相关性的,那么,让所有的人都去买把剃须刀就一定能提升业绩吗?答案是不一定的。
从这个角度看,工业智能需要将传统的计算机科学,人工智能技术和工业领域知识这三方面进行有效的结合才能帮助工业客户解决真正的问题。计算机科学是通过软件整合所有底层技术,包括大数据、云计算平台,选择人工智能算法在这些平台上运行;工业知识的核心是发现业务逻辑。听起来简单的逻辑,在实践中会发现有很多地方是脱节的,现场人员了解业务逻辑,但并不知道数据分析能解决什么样的问题;传统做统计和机器学习的人懂算法,但不了解实际的工业现场可能遇到的问题,倾向于把模型抽象化,到实际的情况当中无法使用。针对这样的痛点,需要相关机构或者人员把三者结合起来,这是一个系统集成的过程,最终为客户提供优质的解决方案。
实践工业智能,我们还有很多技术难点需要攻坚。首先,是定义和发现不可见问题。我们所有可见的问题,比如SCADA系统出现报警或者设备故障,需要运用策略去保护和维护它。如果不能应用在线监控与实时分析,很多不可见的问题很难被发现,比如设备的衰退和发电量的损失等。我们可以使用监测、建模和执行的方法,最终解决、避免不可见的问题。
我们的核心团队在世界各地做了很多的工业项目,涵盖各个工业门类,从实践当中总结出了一套方法论和常用的模型库,常年的工业现场操作对于个人的经验也带来了很大的提升。数据分析和数据建模需要依托于大量的经验,拿到一组上百维的数据,该怎样分析?从哪里开始?是否真的需要数据清洗?是否真的需要做数据降维?这些都是需要经验判断。
工业智能在风电行业的应用思路
下面进入今天的主题,工业智能怎样在风电行业实现?这其实是一个很复杂的系统工程,我们将CPS(信息-物理系统)架构作为解决方案的指导框架,以CPS为基础,以分析技术(AT)为核心,基于物联网(IoT)技术打通从原始数据到业务应用的通道,实现从数据库到模型库最终产生应用库的价值升级。信息-物理系统是一个从感知层到配置层的方法论架构。智能感知层是智能化的数据采集管理,信息挖掘层是从原始的数据当中初步提取有用的信息,网络层通过大量的数据对风机进行处理,认知层是进行协同优化,配置层最终执行优化操作。基于5层架构,通过状态模型、关系模型和决策模型相互指导与支持,形成企业级整体解决方案。
目前,天泽智云所提供的服务包括,从顶层咨询到落地实施的端到端解决方案,最终交付给客户从产品到能力的赋能服务。我们提供的服务之一是数据采集方案咨询,精准的数据采集既优化了数据的传输和存储,又保证了分析的准确度,是整个智能应用的基础。智能化的运维管理平台最终目的基于装备的性能评估、预测性诊断以及运维管理的调度优化,最终实现风场的无忧运行。简单来说,就是故障发生的时候知道故障在哪,未发生故障的时候知道何时发生故障,在具体的运行当中可以通过优化方法来提升运行效能。
为什么说风力发电是运用人工智能最理想的行业呢?GE的Predix、IBM的PMQ、西门子的Mindsphere都以风电作为实践工业智能化的案例,因为风电是相对独立的系统,且数据完善;同时风电属于重资产的设备,维修维护成本高,迫切需要智能维护来降低成本;再者风电以集群的形式出现,可以在网络层运用一些数据传输、数据管理等方法进行分析。
天泽智云的核心团队自2010年起,在风电行业积累了大量的数据模型与应用实践。*的工研院、华锐、美国可再生能源实验室(NREL)、上海电气的智能运维系统以及目前国内正在开发的智慧风电系统,通过不断的探索与改善,逐步实现了从失效维护到故障预测与健康管理(PHM)的跨越。PHM技术的核心是在设备出现故障之前对剩余寿命进行预测、对设备运行策略进行优化,对维护策略优化排程。
在实践当中,研发团队也面临着这不断的挑战,从风场角度,需要对风场进行整体优化,如何做到全局最优;从设备角度,全生命周期的费用不断下降,模型的复杂度不断上升,这样的需求缺口(gap)如何填补。从模型上来讲有四大部分,一个是机理模型,机理模型使用第一原理建模反映风机的输入输出关系;第二个是数据模型,通过运行数据拟合风机运行参数;除此之外是混合模型,结合机理模型和运行数据提升模型准确度,在机理模型不够准确的情况下,使用运行数据优化模型表现,如GE的PowerUp,另一方面,在数据过于复杂的时候,使用机理模型去提取特征;最后一个是运用可靠性分析的方法对设备状态进行评估。
无忧风场的概念
我们所提到的无忧风场即智能风电,基于“人工智能+大数据+运维服务”,几年前很难甚至不能实现,现在可以实现。随着科技的进步,智能感知技术所提供的测点的不断增多,在感知的基础上增加更多有效的信息,智能分析技术提供更加精准的趋势性的分析结果,智能决策技术是通过协同优化来减少运维成本,智能执行技术最终结合人员,背景信息和优化结果,通过更有效的方法实践运维操作。我们认为将以上所有智能的技术结合起来才能达到智能化的目的。
对于无忧风场而言,最重要的就是要避免不可见问题。控制和报警策略是解决可见问题,有两个部分是需要我们去做的,早期故障诊断与劣化速度的管理需要运用先进的信号处理和故障预诊技术,另一个是数字化风机建模(Digital Twin),就是GE所说的数字化风场,运用风场集群建模和风功率预测的调度与维护策略优化等方法得以实现,以上分析方法结合起来形成无忧的风机与无忧风场。
无忧风场的技术实现
为实现无忧风场,可以分为感知、分析、决策和执行这四个部分,我们需要做的是感知外部环境和自身状态,这其实也是我们现在技术进步的体现。有更多的传感器,更多的信息,通过分析产生的影响对于决策的支持,从而形成一套综合的解决方案,进行统一地优化调配。刚才也有专家提到:系统是相互独立的,缺乏数据地融合。之前我们做的建模大都是独立存在的,会不会受到数据或者外部环境关联性的影响——这是需要讨论的。从分析的角度上来说,历史信息到底用了多少?预测的方法是否使用?从决策上来说,维度有多大?能不能做到整体的优化,从排程上,有没有发挥集群的优势?到底是对单台机还是对整台机?无论是对整个区域性的风场还是对整个集团公司而言,我们要不断的进行优化。想要实现这些,就需要我们所提供的智能化技术的整体框架去填补系统与系统之间的空白和系统内没有完成的任务。
智能感知层、分析层、网络层、认知层和执行层,所有具体的功能点和功能点之间的数据交互,涉及了每一个具体的部件如何评估机器状态,每个部件到单机如何进行整合,最后到风场如何做一个集群的分析和优化。使用任何开源的工具和已有的方法,主要运用机器学习、模式识别、统计学习、时间序列以及信号处理等,帮助企业去制定一个合理化的解决方案。
从建模的角度上来看,有三大类:分别是机理残差分析、基线模型和现状自比较、同类比较。衰退评估可以帮助我们进行异常检测、故障诊断和寿命预测。从技术架构上,我们也是分解了很多技术点:风机性能的数据建模、衰退评估、风功率预测的维护排程、调度和优化。
整体上来说,我们的解决方案包括了风机和风场两大部分,包括区域和整体的的结构更新。基于这样整体的一个构架,我们做了智能风电运维系统的Demo,包括展示界面和信息的通信,所有的核心算法,我们拥有自主知识产权。具体举些例子,风功率的体现可以有多种方法,拟合曲线和曲线偏移组成的方法只有在实践积累中才能分辨好坏优劣。基于单机和基于集群两种不同的方法进行比较,在单机当中找到最差的,在集群当中根据表现驱动进行比对,比如发电性能评估,运用SCADA系统,基于模式识别的方法找出故障,以此来定位故障点,形成了一套完整的技术体系。
风电行业的机遇与挑战
从智能风机到智慧风场,从运维中心到风场,其中的核心算法和业务构架以及具体IT实现的路径,我们形成了一套完整的解决方案。但是实践起来仍需要考虑几点困难,第一系统如何设计,这是一个复杂系统工程,第二系统如何实施,数据源、模型选择和在线运行框架等,在实际运行当中可能会出现很多挑战,第三系统如何泛化,每台机器的状态都是不一样的,这时候就需要考虑模型的泛化能力,第四是怎样解释,模型不能过度拟合,一旦过度会导致无法应用,怎样发掘一些真实的有代表性的特征,在评估的结果当中与机理模型做比对,得到可执行信息。
从建模层面来看,在风力发电行业,数据上,第一是小样本,即失效的不多,或者说失效的发生后不再采集数据;第二是多工况,不同的运行状态不同的风速应用在不同的工业场景;第三是高复杂,有很多的复杂设备;第四是小应用,每个应用针对具体的核心点去解决。方法上,强化学习,如果难以表现如何进行优化?深度学习,如何做特征的深度拟合;半监督和无监督式学习,一部分数据有标签,一部分数据没标签,可以优化算法输出;迁移学习是对象状态发生变化,样本模型如何更好的拟合?在数据和方法上存在这些机遇和挑战,只有不断克服挑战,才能达到更准确、更稳健、更泛化、更易用的效果。
我们希望可以坚持5个R——把正确的信息传递给正确的人,让他在正确的时间做正确的事,给客户提供正确的价值,其实也是我们这个工业智能系统的核心,我们做了这么长时间的风电和工业智能化,希望把工业智能化的方法应用在实际当中,用正确的方法去解决工业问题!
人工智能赛博物理操作系统
AI-CPS OS
“人工智能赛博物理操作系统”(新一代技术+商业操作系统“AI-CPS OS”:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。
AI-CPS OS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。
领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:
重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?
重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?
重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?
AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:
精细:这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。
高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。
-
边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。
AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:
创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;
对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;
人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间。
给决策制定者和商业领袖的建议:
超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;
-
迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新
评估未来的知识和技能类型;
-
制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开
发过程中确定更加明晰的标准和最佳实践;
-
重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临
较高失业风险的人群;
开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。
子曰:“君子和而不同,小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。
如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!
新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。
产业智能官 AI-CPS
用“人工智能赛博物理操作系统”(新一代技术+商业操作系统“AI-CPS OS”:云计算+大数据+物联网+区块链+人工智能),在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
长按上方二维码关注微信公众号: AI-CPS,更多信息回复:
新技术:“云计算”、“大数据”、“物联网”、“区块链”、“人工智能”;新产业:“智能制造”、“智能金融”、“智能零售”、“智能驾驶”、“智能城市”;新模式:“财富空间”、“工业互联网”、“数据科学家”、“赛博物理系统CPS”、“供应链金融”。
官方网站:AI-CPS.NET
本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!
版权声明:由产业智能官(公众号ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:[email protected]