敏捷异构HADOS开发平台,充分释放DPU极致性能

时间:2022-12-21 17:02:03

DSA架构和XPU芯片的兴盛在给解决算力问题带来新机遇的同时,也给软硬件开发带来了新的挑战。与传统的以CPU为核心的应用开发模式相比,DPU在网络、计算、存储等的应用场景相对来说复杂度更高,且随着IAAS层的技术发展和快速演化,这些应用场景的变化迭代也给DPU的规模化应用带来巨大挑战。

中科驭数HADOS® 是一款敏捷异构软件平台,通过灵活高效的编程接口将DPU的异构计算能力完全开放,可以帮助开发者快速构建DPU应用和服务。HADOS®平台集成了DPU关于网络、安全、存储以及计算等方向的应用层的接口和开发相关的接口,并打包简单易用的方式,兼容了不同方向上应用的SDK,为客户提供简单、易上手、多场景使用的软件平台。通过HADOS®平台,可以将中科驭数DPU产品性能释放到极致。

■ HADOS的历史演进

敏捷异构HADOS开发平台,充分释放DPU极致性能

早在2018年,中科驭数在打磨硬件产品的同时,就十分重视软件方案与系统生态的发展。伴随着中科驭数第一代芯片的发展,2019年10月,HADOS®平台的前身KOS 1.0版本正式发布,主要在虚拟化与低时延方面提供软件支持,并开始与客户在实际应用中不断打磨迭代。

随后为了更好的配合DPU产品体系的发展,2020年KOS系统重新定位并更名为HADOS®,在网络与存储卸载、大数据计算方面有了进一步的积累,落地于金融数据中心的标杆客户。

到了2022年,伴随着中科驭数第三代芯片的研发推进,HADOS®平台演进到了2.0版本,支持P4可编程网络转发引擎,多元化的存储设备和存储网络,灵活可靠的安全解决方案以及大数据异构加速能力,为DPU生态发展铺垫了良好的基础。

中科驭数已经形成DPU芯片搭载HADOS®软件平台的技术产品体系,并不断打磨迭代。

全景视角看HADOS的开发架构

敏捷异构HADOS开发平台,充分释放DPU极致性能

HADOS®在整体设计上是三层架构,分成设备驱动层、应用驱动层和应用开发平台层,帮助DPU更好地释放异构计算能力。对上,HADOS®支持对接中科驭数DPU所支撑的完整应用生态,用户也可以在不同层次直接调用底层的接口去完成平台上的应用开发。

从全景视图来看,HADOS®经过4年的迭代,代码总量超过80万行,提供的API接口数量已经超过两千个。在系统适配性方面,HADOS®已完成与十余个主流操作系统以及七种主流CPU架构的适配工作,为用户提供更多的自主选择权。

目前,中科驭数基于KPU架构的DPU全系列产品都已基于HADOS®平台做应用部署与开发。

■ HADOS四大亮点

亮点一

P4领域的践行者,

高度定制化SDN基石



敏捷异构HADOS开发平台,充分释放DPU极致性能


HADOS®支持P4编程框架,提供P4 runtime程序以及gNMI、gNOI的控制面接口,用户可以通过我们提供的P4编译器针对自身需求研发特定的网络控制程序,结合SDN控制器一起组建高度定制化的SDN网络,充分挖掘网络价值。

亮点二

DPU集群的探索者,

业内首创DPU集群方案


敏捷异构HADOS开发平台,充分释放DPU极致性能


通过HADOS®平台,中科驭数实现了业内首个DPU集群方案,支持同主机内多块DPU网卡组成集群。

在网络转发侧,HADOS®平台支持多块DPU之间的硬件状态信息同步,实现多块DPU间的网口聚合能力,在网络转发层面解决单点隐患问题;在系统管理侧,HADOS®在同主机多块DPU网卡间实现K8S集群,依赖K8S自身高质量的监控与业务自愈能力为用户提供一套高可用的控制面集群方案。

亮点三

大数据运算的助燃剂,

轻松打破数据墙


敏捷异构HADOS开发平台,充分释放DPU极致性能


在大数据运算领域,HADOS®平台一方面通过强大的DOE引擎,实现对数据库操作或流式计算的硬件算子加速,提升主机CPU的运算效率。另一方面,依赖于DPU的RDMA与NVMe-oF能力,可以极大地提升大数据运算中的数据交互与数据落盘能力,帮助用户轻松打破数据墙。

亮点四

DPU模拟器的开拓者,

加速客户业务落地


敏捷异构HADOS开发平台,充分释放DPU极致性能


HADOS®平台提供完善的全功能模拟器,此模拟器可以对中科驭数的硬件DPU进行完美模拟,支持自动化测试,尤其是在不同操作系统中,可以很好地在开发过程中引导软硬件解耦,为需要依托DPU硬件能力进行二次开发的用户提供简单易用的开发与测试环境,帮助用户加速开发迭代,提高业务落地能力。

■ HADOS的应用场景

HADOS®的出现,将推动云计算网络、安全、存储等方向上的技术革新,助力大数据计算基础架构创新,打造DPU生态的繁荣发展的软件基础,赋能数据中心、运营商网络高性能计算网络、大数据和人工智能多领域基础设施产业升级。


主要场景


网络场景——虚拟化网络卸载、云原生网络下沉、微服务网络治理、超低时延数据传输;

存储场景——存储I端卸载、存储T端卸载;

安全场景——SDWAN网络加速、构建零信任网络;

大数据场景——大数据计算提速;

AI场景——GPU数据处理加速;

5G场景——5G核心网边缘计算一体化