AI究竟走到哪一步了?

时间:2022-11-08 14:09:14

  过去几十年,AI的发展经历了数次起落,就像过山车。最近一次,AlphaGo将人们对AI的期望无限提高,但当时有限的应用场景又将AI的处境拉回现实。彼时,AI虽然很牛,但和每个人的生产生活似乎关系不大。现在,情况不同了。

  衡量一项新技术的发展阶段,业内有不少著名的标尺,比如Gartner技术成熟度曲线。Gartner将每一项技术的生命周期分为5大阶段:技术萌芽期、期望膨胀期、泡沫破裂低谷期、稳步爬升复苏期、生产成熟期。从曲线看,每一项新技术从实验室走向商业成熟都要爬两次坡。

   AI究竟走到哪一步了?

  根据Gartner2022 年度人工智能技术成熟度曲线,智能应用(AI applications)已经翻过了第一座大山,进入到稳步爬升期,距离生产成熟期只有2-5年的时间窗口。

  这与不少行业人士的感受相符,AI应用的发展一日千里,不仅加速渗透进各行各业,还进入了很多传统行业的核心生产系统。为什么短短几年内,AI应用的发展就产生了这种质变?

  上天下井,飞越天堑

  实现AI的大规模商业落地一直是产业界的一大难题。那么,AI为什么很难应用到很多传统行业当中?

  以一个非常传统的行业——煤矿为例,其包括采、掘、机、运、通、洗选等8大场景,共1000多个细分场景。当前矿山行业的AI应用开发,普遍基于传统“手工作坊式”的小模型,即针对不同场景开发不同的AI应用。场景变化后,模型不一定能够很好地适配,甚至需要重新开发。而且,很多场景属于长尾场景,异常样本量小,传统开发模式往往面临“无米之炊”的窘境。

  这形成了AI深入各行各业的一道天堑:在需求侧,真实世界中有海量的行业场景需要AI赋能、降本、增效;而在供给侧, 传统的AI模型开发方式,在成本和效率方面遭遇了双重瓶颈。传统的“一个场景一个模型”的小作坊模式,需要针对每个场景独立地完成模型选择、数据处理、模型优化、模型迭代等一系列开发环节,导致周期长、成本高、效率低。

  面对这道天堑,业内一些初步的探索已经在路上。比如,近两三年来,通过预训练大模型降低AI应用的门槛和边际成本,实现模型的规模化复用,已经成为产业界的共识。大模型仅需要一次预训练+下游任务微调,即可提高模型的行业适应性,同时缩短了模型开发周期,实现“以一敌万”。

  

  比如,针对煤矿行业场景众多又分散的痛点,华为云人工智能领域研发团队开发了盘古矿山大模型,对海量无标注的矿山场景数据进行无监督自主学习,分析不同场景背后的规律与特征。只需要一个AI模型,就可以覆盖整个矿区的1000多个细分场景。

  在主运场景中,基于盘古矿山大模型的AI主运智能监测系统能够精准识别大块煤、锚杆等异常情况,异物识别准确率达98%。过去,矿山主要采用人工巡检,效率低且无法及时发现潜在事故风险。盘古矿山大模型实现了全时段巡检,避免因漏检造成的安全事故,缩短停机时间,同时提升井下巡检人员的工作效率。

  在掘进场景中,基于盘古矿山大模型的掘进作业序列智能监测,动作规范识别准确率超过95%,大幅降低作业流程中人为因素的不确定性,全流程保障井下作业安全规范。目前盘古矿山大模型已经在全国超过4000个井工矿中得到了规模化应用。

  除了深入矿井,大模型也能帮助人类进一步了解变幻莫测的天空。天气预报本质是对于海量气象数据的收集、分析与趋势预判。更加精准的天气预报,将减少极端天气带来巨大的生命和财产损失。华为云推出的盘古气象大模型,能够秒级预测未来 7 天全球天气情况,相比传统方式速度提升 1000 倍、精度提升 20%。在台风预测方面,今年 8 月盘古气象大模型预测台风“马鞍”的轨迹和登陆时间,准确率达 90%,远超行业以前的水平。

  基于盘古气象大模型,华为云为印尼打造了“国家海洋人工智能平台”,预测海洋灾害,保障航行安全。盘古气象大模型还可以为农业、航空、航天等领域提供AI气象分析能力。比如预测雨季的持续时间,为农业播种提供参考;帮助航空航天项目进行防灾减灾等。

  

  AI根技术的突破

  其实,预训练大模型只是AI新技术的冰山一角。

  近几年,很多人通过马斯克了解到第一性原理的概念。第一性原理最早由古希腊哲学家亚里斯多德提出,它是指“每个系统中存在一个最基本的命题,它不能被违背或删除。” 第一性原理可以理解为建筑的地基或树木的根系,是问题的核心本质。在AI产业界,第一性原理就是AI根技术。AI能够加速进入千行百业,其中一个重要原因就是AI根技术的突破。

  在AI业内,一些领军企业已经在向AI根技术发起冲锋。比如,华为云将大模型、知识计算、AI求解器作为AI的三大根技术,并大力投入研发,尝试从本质问题出发,找到本质解。

  预训练大模型,解决AI的规模化复制难题。预训练大模型是在大量图像、文本等数据的基础上,利用无监督或者自监督学习方法将数据中蕴含的知识提取出来,存储在具有大量参数的神经网络模型中。遇到特定任务时,只要调用一个通用的流程,就能够将这些知识释放出来,并且与行业经验结合,解决实际问题。

  近几年,国内外科技巨头纷纷加入练大模型的行列,各种类型的大模型层出不穷。但是,预训练大模型距离规模化的商业应用,还有很长的路要走。在利用大模型推动AI规模化应用方面,华为云的思路值得借鉴。自2021年4月正式发布以来,华为云盘古大模型经历了L0、L1、L2三大阶段的迭代:

  L0是指使用了海量开放数据训练而成的基础大模型,具备基本的物体识别、语义理解等能力。目前,华为云已推出五大水平领域的通用大模型:NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和Graph(图网络)大模型。

  L1是指结合了行业Know-How与领域数据进行训练的行业大模型。这些大模型解决特定行业的应用难题,是行业AI落地的基础设施,如盘古气象大模型、盘古矿山大模型、盘古电力大模型、盘古药物分子大模型等。

  L2是在行业大模型基础之上针对行业具体任务训练的模型,便于行业ISV等客户快速使用。比如,基于盘古电力大模型,华为云针对无人机电力巡检细分场景推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题。

  华为云AI研发团队认为,大模型将成为未来AI 计算的“操作系统”,向下管理AI 硬件,向上支撑AI 算法,使得AI 开发更加规范化、可复制。在2022年全联接大会上,华为云还携手伙伴发布了《预训练大模型白皮书》,将大模型研发和落地的经验向全行业分享。

  

  知识计算,解决行业专家不懂AI、AI系统难以与行业知识结合的难题。不同的行业、领域都有自己数十年甚至上百年的专业知识积累,包括生产系统中的机理模型、行业技术文献、专家的宝贵经验等等。知识计算就是把各种形态的知识,通过一系列AI技术进行抽取、表达后协同大量数据进行计算,进而产生更为精准的模型,并再次赋能给机器和人的一种全新方法。

  在华为云发布了业界首个全生命周期知识计算解决方案之后,2022年5月,华为云携手中国人工智能产业发展联盟和中国信通院,发布《知识计算白皮书》。华为云知识计算解决方案通过将知识加入到行业问题建模和求解的计算过程中,让模型具备更好的可解释性,使得 AI 与行业得以深度结合,真正融入进业务流程,解决核心业务问题,催生体验变革、效率提升以及模式创新,加速 AI 应用行业落地。

  AI求解器,解决企业优化决策问题。求解器能够将现实世界的海量全局因素以及人的经验转化成数学模型,计算出最优解。传统求解器应用难度大,企业的应用率并不高。为了降低求解器的使用门槛,华为云推出业界首个将AI和数学规划结合的商用AI求解器——天筹AI求解器。

  在各行各业需要全局统筹优化的领域,天筹AI求解器已经大显身手。比如,帮助深圳国际机场优化航班调度,每年让260万旅客不再坐摆渡车;帮助华为供应链实现超大规模的多工厂生产排程,让供应能力最大化,将库存齐套率提升37%,每年节省巨大资金。

  在2022华为全联接大会上,华为云全新推出天筹AI求解器智能建模工具,将建模和模型维护过程智能化,简化了开发人员的建模工作,大幅压缩原本需要数月的建模时间,将求解建模速度提高30倍。值得一提的是,天筹AI求解器智能建模工具应用了NLP技术,以及业界首创的低代码+可视化编排建模技术,实现业务需求一键转化为执行代码,开发人员无需受困于编程环境与建模语法,还可以高效复用模型库中覆盖10多个领域、30多个细分场景的经验模型。

  

  没有AI赋能不了的行业

  知名商业顾问刘润在2022年度演讲中提到一个成本价值模型的概念。他指出,任何商业创新都是一边把价值右移,解决更贵的问题;同时把成本左移,创造性降低成本。

  AI的发展也是同理。三大根技术通过技术创新,不断降低AI使用的成本,降低各行业使用AI的门槛;同时将技术创新与商业创新结合,让AI到更广阔的千行百业解决更广泛的问题,创造更核心的价值。AI进入千行百业的过程,就是不断迭代成本和价值模型的过程。这也是Gartner技术成熟度曲线中, AI应用下一阶段走向生产成熟期的关键。

  很多人都会好奇,未来,AI还能应用到哪些行业,哪些场景?在三大根技术的不断发展的背景下,可以说,AI的应用场景远超今天人们的想象。

  在医疗行业,大规模基因组计划被誉为生命科学的“登月计划”,是发现药物新靶点的重要途径。华为云AI基因平台(AI for Healthcare)支持大规模、全生命周期的基因组计划,将为疾病预防、诊断治疗、药物研发提供AI技术支撑。通过独有的 AutoGenome算法,华为云AI基因平台能够对基因组数据进行自动 AI 建模、分析和解译,构建疾病与基因之间的深层次图谱关系,加速药物靶点发现。

  目前,华为云AI基因平台助力国外的“百万人基因组计划”,实现单日分析数据超过 1PB,相比传统 HPC 方案提速 10 倍以上,成本降低 40%。

  

  在交通运输行业,船舶在港时间是指船舶抵达港口待泊锚地到靠泊完成装卸作业离开泊位之间的总时长,它已经成为衡量国际港口核心竞争力的标准。在吞吐量为2,000万箱的天津港,港口调度需要考虑千万甚至亿级的变量和约束条件。如果靠人工做计划的传统方式,需要24小时,而且无法应对突发变化并做到全局最优。

  基于华为云天筹AI求解器,天津港通过港口智能计划,将作业计划耗时从24小时缩短到10分钟,将船舶在港的时间节省了7%。同时,由于码头装卸效率提升,一个吞吐量300万标箱的码头,每年可增收2900万。

  尽管未来很难预测,但AI穿越技术周期的步伐永不止步,直至某一天AI将无处不在,成为智能社会无感知的基础设施。加速千行百业智能化,AI已经跨出一大步。但就整个旅程来看,一切才刚刚开始。