大模型时代下的自动驾驶研发测试工具链-SimCycle

时间:2024-03-09 20:47:10

前言:

最近OpenAI公司的新产品Sora的发布,正式掀起了AI在视频创作相关行业的革新浪潮,AI不再仅限于文本、语音和图像,而直接可以完成视频的生成,这是AI发展历程中的又一座重要的里程碑。AI正在不断席卷着过去与我们息息相关的每一个行业,而自动驾驶行业更是AI发展的重要应用方向之一,从原来的仅在感知层面应用AI算法到如今的端到端全栈AI,自动驾驶算法的研发也不断在革新,与此同时伴随研发的一系列测试验证方法以及工具链也在不断更新突破,今天将分享我们的自动驾驶研发测试工具链解决方案-SimCycle

数据闭环的差异:

提及自动驾驶研发,就不得不提到一个概念——数据闭环。数据闭环的概念实际上也并不是自动驾驶领域的专属名词,在传统的软件工程中就有这个概念,我们可以看一下传统的数据闭环和自动驾驶的数据闭环的差异:

       可以看出,AI模型的加入使得传统数据闭环衍生出了一条分支,而这条分支就是AI迭代的流程。采用数据闭环来驱动AI算法迭代,目前已经被公认为是提升自动驾驶能力的必经之路。因此与之相对应的工具链需求也就应运而生。

SimCycle工具介绍:

       SimCycle是东信创智推出的云端数据闭环工具,是围绕自动驾驶算法开发、测试验证、仿真评价等迭代流程的一系列闭环解决方案,其核心亮点是具备完整的闭环方案,涵盖“数据采集、数据处理、数据挖掘、数据合规、数据管理、数据标注、模型训练、数据监控、数据仿真、评价”等模块,通过SimCycle可以帮助客户构建一条具有完整的自动驾驶算法研发流水线的自动化数据工厂,加速自动驾驶的研发。

工具特点:

       目前自动驾驶算法按照架构来区分,包含两个非常重要的核心算法:感知和规控。它们各自拥有自己的闭环。感知算法是AI算法模型,从研发模式来讲属于AI数据闭环,而规控算法的研发模式则更接近于传统数据闭环。两条环路在算法集成阶段正式进行汇融,进入算法的整体迭代流程,这是当前阶段的研发特点。而由特斯拉引起的基于端到端全栈AI算法的测试和验证方案我们仍然在持续探索。

  1. 数据采集与回灌

数据采集是获取数据的关键方法,根据数据的最终用途,会分为总线类和原始感知类数据,针对不同类型的数据又会有不同形式的采集设备的需要,东信创智目前可以提供全量数据的采集与回灌解决方案,包含车辆CAN/LIN/FlexRay/车载以太网等总线、摄像头、激光雷达、毫米波雷达、超声波雷达、组合惯导、IO等信号的采集与回灌。

  1. 数据管理与处理

数据管理与处理模块,主要解决当前阶段自动驾驶系统的非结构化、半结构化数据、多模态数据的存储和利用问题。不同的行驶数据,包括车端、云端数据最终都会统一进入相应的数据库,落成统一的数据格式,再进入后续的数据处理流水线中。

数据处理流程则包括基于AI模型的数据脱敏合规、预处理、切片清洗筛选等步骤,为后续的数据标注、场景挖掘、模型训练、数据仿真等流程提供标准化的输入物。

  1. 数据标注

数据标注通过云端AI大模型的部署,可以大大的提升标注效率。标注内容支持3D、4D标注、图片分类、语义分割等,通过AI大模型的自动化预标注,可以让人工标注的工作量减到 5% 左右,95% 的数据都可以通过自动化标注来完成,自动识别率可以达到90%以上。标注后的数据将会被打上标签信息,这些数据既可以用于模型训练,也可以用于算法评价,同时生成的标签还可以用于数据集的检索。用户可以更加快速和便捷地对数据集进行管理和操作,从而提高使用效率。

  1. 数据仿真与评价

数据仿真包含Logsim与Worldsim两种模式。Logsim是基于实采数据以回放的形式进行开环测试的方法,用于验证迭代后的算法,可以对感知、规划、预测、定位等模块单独进行验证也可以集成验证,是一种十分有效的回归测试方法。但是这种方法的核心是回归,即复现实车遇到过的场景case从而进行验证,而无法解决未知场景下的验证。而Worldsim则可以补足这个缺点,Worldsim是基于建模的原则,根据需要搭建仿真场景,包含交通规则、环境、道路等多种因素,实现虚拟场景的*创建、场景可泛化,是真正意义上的仿真,通过搭建场景模型、交通模型、动力学模型、传感器模型、控制器模型等还可以实现算法接入后的完整闭环。但是Worldsim也有其局限性,虽然Worldsim可以实现云端高并发仿真,大大提升仿真效率,但当前阶段多数仿真仅限于规控算法的闭环,未考虑场景高精度渲染,同时仿真场景的构建较为复杂,存在搭建难度大、人力消耗大、仿真还原度低等问题。所以Log2world的概念也随之衍生出来,Log2world即路采数据通过数据挖掘、特征提取以及数字孪生等技术,可以转换为Worldsim运行所需要的场景标准格式文件如OpenX等,从而实现对路采数据的仿真转换,并可以进一步对场景进行泛化等操作。

在此基础之上,东信创智还提供大量的自动驾驶功能评价算子,覆盖感知、规控等多个模块和多个维度,用于在仿真过程中给客户提供更精准的反馈,指导算法改进,同时也开放评价管理接口,用于客户开发自定义评价算法。

  1. 模型训练及部署服务

东信创智整合了一些国内知名的云商资源,在可以提供上述工具解决方案以外,还可以提供模型训练、仿真测试以及云上部署等服务,满足客户私有云、公有云以及弹性混合云的需求,提供全栈式服务和解决方案。

总结:

智能驾驶行业正处于高速发展的阶段,同时大模型技术的兴起也正在不断的对以往技术进行革新,自动驾驶需要发展的道路还很长,东信创智将持续挖掘和整合最前沿的AI技术,为客户提供最有效、最落地、最先进的解决方案,成为客户最值得信赖的伙伴,共同助力自动驾驶时代的到来!