2023 IoTDB Summit:昆仑智汇数据科技(北京)有限公司董事长陆薇《IoTDB在先进制造领域数据资源管理运营的应用》...

时间:2024-01-28 13:40:53

12 月 3 日,2023 IoTDB 用户大会在北京成功举行,收获强烈反响。本次峰会汇集了超 20 位大咖嘉宾带来工业互联网行业、技术、应用方向的精彩议题,多位学术泰斗、企业代表、开发者,深度分享了工业物联网时序数据库 IoTDB 的技术创新、应用效果,与各行业标杆用户的落地实践、解决方案,并共同探讨时序数据管理领域的行业趋势。

我们邀请到昆仑智汇数据科技(北京)有限公司董事长陆薇参加此次大会,并做主题报告——《IoTDB 在先进制造领域数据资源管理运营中的应用》。以下为内容全文。

目录

先进制造领域特点与典型数智化场景

高效管理和利用数据资产是工业企业走入数智化深水区的必修课

昆仑数据&工业大数据创新中心简介

首先非常感谢大会的邀请,今天有这个机会跟与会的各位嘉宾来做一个交流。早上在 Mohan 教授“忆当年”的那一页 PPT 当中,还很高兴的看到了十年前我自己更年轻的一个身影。也很高兴看到,在过去这十年的时间,IoTDB 从当时的一个想法,经过这么多年的发展之后,先是一个 Apache 社区的小项目,最后变成一个*的项目(TLP),到现在成功毕业之后,有了这么壮大的一个社区,能够在各行各业都得到非常广泛的应用,真的是特别特别的开心

今天我跟大家分享的内容是《IoTDB 在先进制造领域数据资源管理运营中的应用》,大概是这几部分内容。首先,因为在座的我想大部分都是来自于工业界,但是不见得都是来自于跟先进制造相关的领域,所以我会先简单介绍一下先进制造领域的一些特点,和在这个领域里面一些典型的数智化场景。另外会跟大家分享一下,我们现在看到在工业领域,特别是在先进制造领域,其实工业数智化已经开始从浅水区逐步地走到深水区,那走到深水区的时候,其实是会面临非常多的挑战的。在这样的一个时期,对于工业企业来说,它如何建立起高效地管理和利用它的现场数据资源的一套体系,其实这是现在所有的工业企业在走向深水区的时候,必须要克服的一个挑战,那它们应该怎么做呢?我们也会把我们的一些思考,当然还有一些行业的实践案例跟大家做一个分享。最后会简单介绍一下昆仑数据和工业大数据创新中心。

01

先进制造领域特点与典型数智化场景

首先跟大家分享一下先进制造领域的一些特点。在这里我们讲的先进制造领域就是两类,一类是一些高端精密的产品制造业,这个大家比较容易理解,比如说芯片、显示面板、一些高端的电子器械等等,基本上我们把手机打开,50% 以上的器件都是落到这样的一个领域里面的。还有一些可能传统上大家不会认为它是先进制造,但其实也是。我们看到在传统的一些制造领域,比如说钢铁冶金、化工、机电设备等等,这些大家觉得好像是非常传统的工业制造领域,但是在这些领域里面也有一些高端的产品。比如在化工领域里面可能有一些精细化工的产品,比如为半导体行业服务的光刻胶等类似的产品;比如在钢铁冶金行业里,一般的建筑钢材、型材可能不算是非常高质量的产品,但是我们高铁的轨梁就是一个非常高质量的产品,它对产品的整体品质、生产过程的工艺控制等等要求都是非常高的。所以基本上这两类其实都是我们这里在讲的先进制造领域,大家也非常容易理解,这个领域确实也是中国制造要由大变强,走向高质量发展的一个非常关键的主战场

在先进制造领域,其实它有非常典型的特点。第一个特点就是它的生产工艺是非常非常复杂的,一个是它的各种工艺控制的尺度上的精度要求非常地高,包括它的物理尺度、化学尺度,电磁的尺度等等。比如大家经常在讲到半导体生产的时候都要讲到纳米,是吧?都是在纳米级的精度。那我们看到显示面板是在微米级的精度,所以基本上都是在毫米以下的这样一些精度。它的物理精度,当然还有一些化学精度,包括材料的纯度,以及如果是电子器件,它对电流电压的敏感度等电磁方面的精度,要求是非常非常高的。这就导致它的工艺控制的复杂性以及对工艺稳定性也是要求非常高,就是在整个生产过程中,需要能够扛得住各种情况,包括因为原材料带来的因素、因为环境的因素、因为人的因素、因为设备机差的各种因素,带来的种种潜在可能对稳定性造成挑战的一些情况,都要能够很好的处理。

另外还有一个特点,就是它的工艺过程非常的复杂,可能都要经过若干个工艺段。比如说我们要做一个 CPU 的生产,大概有 400 个工艺段,从最早的原料到最后的晶圆,完成各种生产可能需要好几个月的时间。在每个工艺段上,可能有非常多的工艺的设备、检测的设备等等,它的工序非常的多,流程也非常的长,而且每个工序段的控制参数其实也都非常多。大家想象一下,比如做光刻,光刻机就有上万个控制参数,但这只是其中的一个环节,我们如果把这几十、上百个环节合在一起,它的整个控制参数的空间非常多,基本上会达到上万、几十万的控制参数的空间,所以大家可以想象一下,这个控制过程是非常复杂的。而且还有一个事情,它带来的复杂度的提升就在于,中间有些生产过程的机理其实不是那么的清晰,因为它可能有机械的、物理的、化学的,各种不同的加工过程。有一些是相对来说简单的加工过程,它可能生产机理相对比较清楚;但有些确实相对来说比较复杂,比如一些物理、化学的过程,它的反应机理有的时候也不是那么的清晰。这些原因就导致先进制造领域的生产过程很长,控制很复杂,同时有些机理还不是非常的清楚,因此生产过程确实非常复杂。

还有一个特点就是它对于设备的依赖度是非常非常高的。大家可以想象一下,这种比较先进精密的产品的制造,其实很难靠人来控制设备,基本上都是高度依赖自动化的设备,无论是现场的工艺生产的设备,还是现场的检测设备,甚至有的时候是现场物流搬运的设备,其实都是高度自动化的。而且走到一个这样的厂里,你会发现它的设备的种类非常的多,可能有上千种不同的设备,而每个设备本身也是非常的复杂,设备本身的机理也是非常的复杂。那么对设备的可靠性的要求也很高,因为本身工序就非常多,环节就非常长,每一个环节里面哪怕只有一点点的误差,累积下来的误差就会非常的大,所以对每个环节设备的可靠性和精度的要求都是非常高的

还有一个很重要的特点,也是现在这个行业里面临很大挑战的,就是它对专业人员的依赖度非常高。就是因为前面的工艺复杂、生产过程复杂、设备复杂,就导致现场对人的经验的依赖非常大。虽然我们听到比如说富士康搞了个“黑灯工厂”,但是大家知道黑灯工厂只是说整个生产过程已经全自动化控制了,并不等于现场是完全没有人的。现场其实有非常多的人,但是这些人不是产线上的操作工,而是现场有非常多的白领,有大量的设备工程师、工艺工程师、质量工程师等等。这些人在现场就是准备处理各种异常的情况,因为所谓的自动化生产只是按预设的工艺过程的要求,可能能够去做自动的生产,但是自动不等于智能。实际过程中会有非常多异常情况的发生,所以现场还是需要有非常多的人来做干预,一方面是解决一些异常的情况,另外一方面其实是在现场做很多的改善,包括设备可靠性的改善、生产供应控制的改善、产品质量的改善等等,所以现场其实人是非常非常多的。而且对这些人的专业性要求、技能要求、经验要求也是非常高的,所以对很多先进制造业的企业来说,有一个非常头痛的问题是这种人特别难招募,而且这种人的培养所需要的时间、精力、投入也是非常大的。所以如果说一个企业业务发展好的时候,背后潜藏的另外一个挑战就在于扩产能的同时对人的需求,怎么找到这么多的人,这就是一个非常大的挑战。

其实也就是因为有这样的挑战,就带来了在先进制造领域里面,其实我们看到数字化有非常大的价值。另外一方面,也是因为在这样的生产领域里面,它的自动化的程度高,大部分都是依赖于自动化的设备,所以现场的数据也相对来说是比较连续完整的,即使这些企业有的时候不是连续制造的,而是离散制造业,但是它现场的数据也是比较连续完整的。那么我们可以基于这些数据,来替这个领域里面的这些企业创造非常多的价值。

93163dd76676ae6cad7d5a246c90f0b7.png

其实有几大类,是我们在先进制造领域里面看到的,通过数据和数智化的技术,可以替企业去创造的价值。第一类就是提升它的产品的质量。因为对这种企业来说,它的质量、它的产品的良率基本上就等同于这个企业的利润率,而且因为它的工艺复杂、控制过程复杂,这些企业基本上都面临各种各样的良率的问题。那我们用好数智化的技术,一来可以帮助它来做工艺的优化,做工艺的稳定性的提升,也可以做到整个产品质量的全程的追溯。如果发生了不良,我们可以通过数智化技术帮它来分析这个不良发生的根本原因到底是为什么。如果发生质量的波动,那波动性的预测,甚至提前的控制,也是可以通过数智化技术来帮助它的。当然还有一方面,如果能够把设备的可靠性、把设备的劣化趋势能够控制得比较好,肯定也是对产品的质量有非常好的帮助作用。

在提升产品质量之外,其实还有一方面,就是如何提升效率。提质增效是工业里永远的话题,无论是原来自动化的时代、信息化的时代,到现在数字化的时代,其实大家都是在用不同的手段帮助企业实现同样的业务目标。从降本增效的角度,其实也有非常多我们可以利用数据、利用数智化技术来做的事情,比如说我们可以优化它设备的 OEE,就是优化设备综合效率/稼动率,可以提高设备资产的利用率;我们也可以用数智化的技术帮助企业提升整体的生产效率和产能,让它在不增加设备投入的情况下,能够产出更多的产品。同时,刚刚讲到,因为现场有非常多的工程师,那怎么能够管好这些工程师,提升工程师的人效,把所谓的现场人机比进行优化,对于企业来说也是有非常大的降本增效的作用。还有,对于一些高能耗或者是高物耗的企业,如果我们能够把能耗和物耗做很好的管控和优化的话,其实也是可以帮助企业来降本增效的。

除了提质增效这两方面,还有两类是数智化技术可以帮助企业来实现的。一类是帮它们提升客户的满意度,特别是对很多企业来说,如果它服务的是像苹果或者华为这样的大客户,那客户满意度是非常非常重要的一个事情。甚至苹果或者华为供应链上的这些厂商会比拼自己的技术能力和生产过程管控的能力,来争取到更多的订单,然后厂商可以跟它的大客户说:“你看,我的生产能力比它强,我的现场的控制能力比它强,那你是不是明年可以把更多的订单给到我?”还有,如果企业的客户提交了一个客诉,提出某一批产品有问题,那么能在多快的时间内响应这个客诉,告诉客户这个问题是什么原因造成的、整改措施是什么,这对于提高客户的满意度是非常重要的。

还有一方面可能并不直接的产生经济效益,但长期来说,它对于企业内部的竞争力的提升是非常重要的,就是如何能够在企业内部加快创新的过程。在先进制造业里面的创新,包括新产品的研发,通过小试、中试,再到批量生产、量产,这个过程能不能通过数智化的技术帮助加速?再比如要上线一个新的生产工艺,那这个新的生产工艺的研制过程是不是可以通过数智化的技术来加速?对于工厂来说,其实一直要做永无止境的精益化的改善,那么是否可以通过数智化的技术,在原来传统的、可能是靠现场的很多经验之外,能够通过数据的手段更快的发现问题,更好的解决问题,其实这些都是在企业内部能够帮助它加速创新,提升长期的企业竞争力的非常有价值的一些做法。

这是我们在先进制造领域能看到的,我们可以通过数智化的手段帮助它们,增加它们的竞争力的一些典型的场景。

9ee1e151093c2a789f22d25626d5e4e3.png

其实我们也看到,有很多先进的企业,包括国际的、国内的一些企业,普遍已经在全面地拥抱数智化,并且有些企业已经有非常现实的一些收益。比如我们比较熟悉的“宁王” 宁德时代,宁德时代最近投建的新工厂基本上都是按照全数字工厂的标准来建设的,所有设备生产过程中的数据是全采集的,而且这些数据他们也在用不同的手段在做数据价值的挖掘和利用,以帮助他们不断地改善工厂内部的运营和提质增效。

当然还有一些企业,比如日月光其实是中国*的企业,它是全球最大的做半导体封测的企业,这个企业也是在行业内非常早地,大概是十年以前,已经开始尝试使用一些数智化的手段,用数据的深度分析和他们的生产工艺、设备等等进行紧密的结合,帮助他们提升产能、提升效率、推出新产品等等。

因此我们已经看到,其实这是一个非常明确的能够帮助客户创造价值,而且一些先进的企业已经获取了价值的领域。

874a9f76e49d1f54ae440eef3cd10d81.png

02

高效管理和利用数据资产

是工业企业走入数智化深水区的必修课

毋庸置疑,“数智化”这件事应该要做了,那下面的问题就是怎么做?也就是对于一个工业企业来说,它怎么高效地管理和利用它的数据资产,能够让这些数据资产解决它现场的一些问题,替它来创造价值,这个显然是现在工业企业要走入数智化深水区的一个必修课。

图中是一个市场研究公司,它给出的各个行业的数字化转型进程的波次。我们看到,今天讲的制造业其实是在中间这一条,中等灰度的这一条。那么好处在于哪呢?好的一点在于,制造业如果采用了数字化之后,其实能够产生的行业的增加值是最高的,也就是图中的纵轴值是最高的。但是不好的一点是,如果我们看横轴就会发现,虽然在这个行业里面应用数字化能产生非常高的、比其他行业都高的行业的增加值,但是它从产业进程的角度,目前相对来说不算是非常先进的。比较先进的还是像图中的信息密集型的,像金融保险、信息通讯这样的行业,可能数字化程度会更高一些。制造业相对于这些行业的领先者来说,其实目前进程还是相对落后,还是在一个追赶的过程当中。从我们自己的实践中看,确实也是这样,即大家是拥有一个产业的共识,就是我们都要全面拥抱数智化,但是从实际的进展的角度来说,确实现在还是只有少数先进行业的先进企业在开始做这样的工作。

就制造业来说,目前的主流其实还是在做“两化”的补课,也就是在做自动化和信息化的补课,以及在上物联网的系统,能够把数据先收上来,先有浅度的一些利用,可能下一步才会考虑怎么深度地利用这些数据,目前正在这样的一个过程当中。

667fe7190fbfe75819e9ccc9a2ccb2f1.png

之所以在制造业中数智化的进程不是非常的领先,其实主要的挑战在于现在在很多工业的现场,它的数据资源化的程度不高利用率也相对来说比较低,同时价值挖掘确实也会比较难

在工业现场的数据资源化的程度不高,主要是两方面的体现,一方面就是数据集成度不高。大家都知道,数据其实是来自于有些业务线上化了之后,就开始产生数据,比如说控制过程用的自动化系统线上化了;整个经营管理的过程,通过 MAS、ERP 这样一些信息化的系统线上化了,就开始有数据。这些数据其实都是通过这些设备和业务系统来产生的,但是现在的情况下,这些数据本身跨业务系统的整合其实做得不是很好,很多数据还是从单个的业务系统里面出来的,可能支持的仅仅就是这个领域的一些应用。目前做全企业跨领域的、跨业务系统的数据整合,其实整体做的是不太好的,甚至在很多企业还会出现同样的一个数据,在不同的业务系统的口径不一样,就造成我们想要对数据进行综合利用的时候,没有很好的原始资料,需要做很多的数据治理的工作。

所以一方面是工业现场数据集成度不高,即跨业务系统的集成度不高,另外一方面,其实它的业务集成度也是不高的。我们讲的业务集成度,其实是在讲数据的应用和业务的集成的深度。我们会看到现在有很多浅度的数据应用其实已经非常普遍了,比如做物联的接入、实时的展示、控制、历史数据报表的分析等等,这些都已经非常普遍了。但是另外一方面,我们会看到数据在工业领域里面的一些深度的应用,相对来说还是比较缺乏的。最主要的问题就在于,工业数据要深度应用,就需要跟这些工业的机理,比如说设备的运行原理、生产的工艺,深度结合才能够做好,但是这中间有非常多的技术和非技术的挑战,导致现在做得并不好。

我们看这个矩阵图,如果只是针对单业务系统和一些浅度的业务方向,那这个市场已经是红海了,各种应用非常的多。但是我们稍微往远处再展望一下就会发现,其实有非常多的蓝海,还有很多的数据和数智化可以去发挥价值的空间,其实并没有得到很好的探索。所以今年工信部出了 2023 年度的智能制造解决方案揭榜挂帅的项目申报,中间列了有 21 个题目,这 21 个题目都是现在公认的,在这个领域里非常急需又亟待解决,但是目前还没有解决得很好的问题,第 18 个题目其实就是数据资源的管理和应用解决方案。它一开篇就指出问题是什么:现在工业数据的利用率低、价值挖掘比较难,所以大家还是公认这是一个没有被很好地解决的问题。

c1e234833c4da5c67754a9b4fa48a1b2.png

那下面大家肯定要问了,如果我们想解决这样的问题,应该怎么办呢?在讲技术怎么办之前,我们先要讲讲人的问题。因为所谓“事在人为”,事都是由人来做的,所以我们现在也来分析一下做这个事需要一些什么样的人。

其实释放工业数据的深度价值,是需要工业专家和数字化、信息化专家的深度协同和配合的。左边这个图是一个标准的关于数据科学的定义。从数据科学来说,它是三个领域的交叉点,一个领域是所谓的 Domain Expertise,如果放在工业里面,那就是工业技术,Operational Technology。另外一块是数学,Mathematics,就是这些有数学、运筹学专业背景,搞算法的这些专家。还有一个领域,Computer Science,就是计算机科学,比如 IoTDB 解决的就是 Computer Science 的问题,数据接、存、管、用的整个过程当中都有非常多的计算机科学的技术。整个数据科学其实就是在中间这个三元交汇的地方。

但是我们很难期待有一个“超人”,一个超级的数据科学家,在这三个领域都是专家,又非常地懂领域知识,又非常地懂数学,在计算机科学方面也很专业。如果我们有这样一个超人型的数据科学家,那我就可以“从头打到尾”了,但事实上在现实中,这是非常罕见的事情。更普遍的是有一些人可能是工业专家,有工业领域知识;有一些人可能是数学专家,在算法方面比较有研究;有一些人可能是计算机科学专家,比如对数据库技术、网络、低代码开发等等技术掌握得比较好。其实是需要有不同背景、不同专长的人,大家融合在一起协同地工作,才能够做好这件事情。

而在这三类人当中,工业里面的工业领域专家其实在这中间是扮演了一个非常引领性的角色。其实别的领域也一样,因为领域专家知道问题是什么,也知道根据领域知识,解决这个问题的大致思路可能是什么。只是他可能没有办法把这个思路写成,比如一个 Python 的算法,能够在现场实时大数据上运行得很好,所以他需要其他人的配合,但是领域专家在中间确实是起到了一个非常重要的引领性的作用。所以我们认为这些现场的业务专家,这些懂现场的设备的、懂现场的工艺的专家,他是数智化业务创新的主角,但是只有他是不够的,他还需要跟另外两类人一起来配合。

853834a634d28595b2ca357d3785247d.png

所以我们要想做好工业现场的数据的管理,特别是它的深度利用的话,其实我们是需要有一套支持不同领域的专业人员能够高效协同工作的方法和工具。在创新的领域里,有个标准的创新模型叫做双钻石模型。第一个钻石其实就是定义问题,大家先发散有哪些问题,然后再聚拢,确定这是一个焦点的问题,要去解决。第二个钻石就是再去发散这个问题可能有哪些解决的方式,最后聚焦到一个比较好的解决方案,大家齐心协力,按照这个方案把它解决了。这个是在创新领域的一个标准的创新过程的模型。

那我们把它套到工业数智化这个领域里面,其实就是如何能够把 IT/ OT/ DT 这三类专家套到这样一个创新的双钻石模型当中,让他们能够非常好地去协同的工作

df36aab5863eac1e9f750f3133f6e5a5.png

其实我们昆仑数据在过去这些年一直在做的事情就是,我们希望能够打造一套可以传授给工业专家的,端到端的工业数据智能应用研发的方法。今天因为时间有限,这个方法我没有办法展开了,如果大家有兴趣的话,可以去看我们研究院院长田春华博士的专著,叫《工业大数据分析实践》,还有一本叫《工业大数据分析算法实战》。《工业大数据分析实践》是在讲整个的方法体系的,这也是我们过去这十多年以来的现场实践的一个总结。我们是希望这件事情不只是像我们这种计算机背景的人自己来干,而是我们真的能够把数智化技术应用的门槛降下来,变成可以给到工业现场的这些工业专家的一套方法,这些专家可能是学机械的、学化工的、学精密仪器的,但他们也能够有效地应用这么一套方法,再加上学计算机、学数学的一些专家的配合,最终能够把一个现场问题解决。

这个方法我们基本上分成四个环,第一个环是一个场景定义的过程,就是如何在现场去发掘和定义一个值得用数据来解决,而且也有比较好的基础,可以用数据和算法来解决的场景,因为好的开题就是成功的一半嘛,这其实是比较重要的一件事情。因为传统的很多方法基本上都是“随机访谈型”,但实际上这是非常不系统的,而我们是有一套比较系统的方法,按照工业的智能阶梯和应用的场景,可以比较系统化地去拆解和定义。特别是这套方法可以让业务专家,他即使一点数智化技术都不懂,也可以比较有效地参与定义出过程,然后能够定义出场景。

如果我们定义出一个值得去解,也有条件、有技术可行性去解的问题,那具体怎么解其实又分成了三个环。第一个环其实是模型算法的研发,包括我们怎么样去理解详细的业务问题,怎么样去找到相关的数据,怎么样去看数据的特征,怎么样根据数据特征去匹配合适的算法,包括对合适算法的参数调优等等,这个是模型算法研发的过程。

这个研发的过程之后,并不是马上就可以去部署和应用了。我们会发现在算法出来之后,其实还要经过再一轮的迭代,就是我验证了这个算法具备可行性,而且 ROI 能够算出来了,企业投入多少和产出多少能算出来,并觉得是值得投入的一件事情的时候,下一步可能才会进入到比较认真的工程化的开发,包括它背后的数据架构的设计、整个数据流的设计、这个算法的一个详细的实现等等,这个是数据工程开发的部分。

但并不是开发完了之后部署上线,就结束了,还没有完。我们发现很重要的是,这个算法部署上线了之后,其实才刚刚开始,我们要让它在现场去产生价值的话,其实是要在上线之后持续地监控和优化它的运营。因为在这个算法上线之后,现场有些条件可能会改变,这个数据的情况也许也会变化,例如有一段时间数据链断了,或者有段时间数据质量不好了等等。所以在上线之后我们是需要持续地进行它的运营的,这还不是简单的运维,即只保持它在跑着不要“死”,其实这是一个业务运营的问题,就是需要保证上线的这个算法模型应用确实能够去解决业务的问题。

配合这套方法论,我们也开发了一套支撑的平台和工具,然后就可以按照这个方法论,用相应的工具来加速整个数据价值创造的过程。但其实方法论是比工具要大的,因为不是所有的事都可以在工具里面来做,比如说场景的定义和探索其实就没有工具的支持,那我们可能通过线下的工作访问等方式来做。我们过去积累了一些行业的最佳实践和可参考的案例,也就是大家按照我们的方法论,针对一个具体的业务问题,是怎么一步一步地做的,可以作为一个很好的参考。

f5acae21ddec9ae0c7f0d9f91c79355c.png

讲到工具平台,我们基于 IoTDB 打造了一套“云+边”协同的平台在云端或者是中心端是一套研发的环境,研发出来的模型我们可以通过在线或离线的方式,把它推送到边缘端。边缘端有点像一个工业手机部署在工业现场,上面可以下载各种各样的数据智能 App,更多的是在现场来处理数据和跟人做交互的在中心端和边缘端,我们都用到了 IoTDB 来作为时序数据存储的引擎。当然存储引擎也不限于 IoTDB,因为工业现场的数据是多源异构的,除了时序数据之外,比如设备台账可能就是存在关系数据库里;可能还有现场的一些比如声闻数据、质检的数据,它可能是图片、声音文件等形式,因此我们可能需要用到对象数据库来存储;所以是需要有一整套支持多种不同数据源的技术引擎,来支持不同类型的数据的存储。

另外在不同的数据引擎之上,我们要构造同一套的数据资产和数据资源管理的体系,还有一套数据资源的价值挖掘的方法,能够把这些数据用起来,去解决业务问题。但是确实从存储这一层来说,IoTDB 扮演了一个非常重要的角色,因为现场的“人、机、料、法、环”中,来自机器设备的数据是最大量的,要把最大量的这类数据管好,就离不开时序数据库。特别是在高度自动化的环境下面,所有设备状态的信息、工艺控制的信息,其实都是以时序数据的形式存在的,所以 IoTDB 在这中间为我们提供了一个非常坚实的技术基础

f65277cc30970d3ddbbb6e8aec8fc17d.png

e1ddaf4e474ca9a10ad7aedba1c56b32.png

我们联合 IoTDB,最终是希望帮助企业建设起数智化创新的平台和整体的组织能力。如果还是用工厂做比喻的话,我们有点像期望帮工业企业建立起一条工业数据的生产线,一头的原料是现场形形色色的数据;产线上处理原料的机台其实就是一个一个分析的模型和应用;产线产出的成品就是我们经过这些机台,从原始数据中萃取出来的有关业务的洞察和一些智能决策的结果,这是产线的部分。

除了产线是从数据中产生价值,我们管它叫柔性的价值管道,上面的这些机台也不是固定的。随着业务的进展,我们要不断地研发新的机台,这就需要另外一个敏捷创新的管道。然后我们根据业务不同的需要和场景,按照一定的方法,不断的研发相应的算法,最后能够把它插到工业数据的生产线上,去处理现场的这些数据,产生有价值的业务洞察。

到最后,有了这么一套体系的支持,在企业内部会形成一个由跨部门、跨专业的团队组成的若干个虚拟的创新小组,每个创新小组可能是针对一个场景,按照这个方法,在这套体系的支持之下来做数智化创新。当然不是所有的创新一定会有结果,都有试错的过程,可能有些在一段时间之后就会发现业务价值不够,或者是技术可行性不够,可能它就终止了,但有些如果能够走到最终,它就会变成我们可以推出到现场去使用的一个应用。

af5038f327cb46e3aafeca012bccde6d.png

我们和 IoTDB 最终是希望帮助企业构造起一个从业务数据化到数据业务化的业务价值的闭环,让数据成为活的资产。因为数据如果只是把它管起来,而不产生应用的话,其实它都不能称为资产;只有它被用起来,在持续不断地产生业务价值,它才能成为企业的活的资产。

e353c0eccc0a14df65384435ad3aa791.png

03

昆仑数据&工业大数据创新中心简介

刚刚讲到了,昆仑数据其实是希望能够把 IT/ OT/ DT 打通,我们内部也是有这样的一群专家,因为我们不仅仅是自己解决问题,更希望能够创造一套方法,能够让更多的工业里面的团队可以按照这个方法来解决问题。我们在 2020 年的时候被世界经济论坛评为全球的“科技先锋”,也是当年先进制造领域里面国内唯一的一个企业。同时我们也负责运营工信体系的工业大数据创新中心,我们现在在北京、苏州和四川三个地方都有创新中心。

我们服务的也都是设备和数据资产相对来说比较密集的行业。今天讲的可能更多是先进制造业,其实我们也服务很多其他的行业,包括能源电力、煤炭油气等一些行业。过去服务的基本上都是细分行业的一些龙头企业,数据基础相对来说比较好,比较希望率先进入到深度挖掘数据业务价值的过程。并且我们服务的很多企业,它们做的很多项目也都是在行业里面比较先行先试的项目,也拿到了一些示范的工程。因为我们也负责运营工信体系的工业大数据创业中心,所以我们除了服务企业之外,也有参与一些编著,比如说 2025 工业大数据技术路线图的编订,以及一些著作等等。

最后强调一下我们的定位,我们还是希望能够帮工业企业建立起自主的数智化创新团队,当然要做到这一点的话,我们需要有相应的方法、相应的工具。同时我们也会用“以战代训”的方式,通过和大家在一起实战的方式,把这个能力交到工业企业的手上。所以未来我们也希望跟更多的工业企业同行,包括跟 IoTDB,作为我们产品的一个非常坚实的重要技术组成部分,大家继续同行,希望能够更好的用数据来推动整个中国工业的智能化的进程

好,谢谢大家。

92a5655ac83f9986f72d6ebdc2a54aa3.png

可加欧欧获取大会相关PPT

微信号:apache_iotdb

6bc5f250b080c5335c97cdff383ddac5.gif