龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台

时间:2021-03-12 01:08:25

龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台

文/尚旭春

Intel Sapphire Rapids(简称SPR)即第四代至强可扩展处理器,是 Intel 承上启下的一代产品。新引入增强指令、硬件加速器、 AMX 矩阵计算、SGX 机密计算、Scalable IOV、PCIe 5.0、CXL1.1 协议,涵盖了计算、安全、I/O 及虚拟化方面的众多技术升级和增强。

龙蜥社区对 Intel 平台的支持一直领先于业界,紧随 Intel 研发节奏,基于 Intel Arch SIG 第一时间完成对 SPR 产品全面的支持,助力龙蜥用户以开箱即用的方式,享用新技术特性,整体支持情况如下图:

龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台

以上特性均在龙蜥社区得到全面支持:

加速器层面,Anolis 5.10 内核已经支持DSA、IAA,配合龙蜥社区提供的 accel-config 用户态工具,用户可以对这两个加速器进行快速配置并使能。对于 QAT 和 DLB ,其驱动已经以 OOT 的形式发布于龙蜥社区,用户只需下载安装对应的 rpm 包即可享用新硬件加速带来的性能提升。

安全层面,龙蜥社区已经集成 SGX 的 SDK/PSW/DCAP 软件栈,并以 rpm 包形式发布,用户可以通过 Anolis 系统便捷部署自己的机密计算方案。

虚拟化层面,Anolis 内核率先支持 SIOV 特性,用户不论是使用 SPR 平台自带的硬件加速器,还是支持 SIOV 的第三方硬件,抑或是 DWQ/SWQ 的部署形式,都可以无感使用,真正做到了 One for All 。

以下以对 AMX 指令的支持为例,介绍一下基于 Anolis 内核构建业务方案所带来的巨大性能提升:

龙蜥白皮书精选:龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台

Anolis 通过支持 AMX 指令并对其进行深层次的优化,搭建如图所示基于 Anolis 内核的深度学习方案,实测表明:

  • 相较于 AVX512 INT8,Anolis-AMX-INT8 带来 8 倍整型性能提升。

  • 相较于 AVX512 BF16,Anolis-AMX-BF16 可以带来 16 倍浮点性能提升。

可以看到,基于 Anolis 搭配 AMX 技术可以极大提升 AI 业务能力。这只是 Anolis OS 对 SPR 进行垂直优化的一个简单示例,更多惊喜可以访问龙蜥官网查看。目前 SPR 平台已经上市,欢迎广大用户下载安装 Anolis OS,丝滑体验新平台 SPR!

Intel Arch SIG 主页:

龙蜥官网:

附:

2022 龙蜥社区全景白皮书(或公众号回复关键字“白皮书”获取)

—— 完 ——