精选博客系列|加速基于同态加密的隐私保护机器学习

时间:2021-12-01 00:39:55

随着机器学习在当今的企业和软件平台中的广泛使用,跨人工智能 (AI) 平台的隐私保护技术的解决方案也显得非常重要。虽然这个想法在今天看起来很明显,但人工智能研究社区历来更专注于打破数据孤岛的界限,并将数据从一个孤岛匹配到另一个孤岛,以此发掘以前未被发现的数据价值。

随着人工智能领域的成熟,很显然,如果不保护私人数据,我们很可能会将我们的数据源暴露在潜在的漏洞中,而引发难以预料的后果。今天,人工智能行业已经通过与密码学家密切的合作来应对和解决人工智能技术的这一关键难题。有一种使隐私数据不公开的解决方法,即在加密的情况下进行数据计算,它被称为同态加密。


什么是同态加密?

同态加密(HE)属于一类用于隐私保护计算的高级加密技术。它允许对加密数据进行计算,而无需解密,只允许授权方解密计算结果。这种独特的加密技术允许数据在静态、传输和计算过程中保持加密状态。自 1970 年代后期以来,人们一直在寻求对加密数据进行任意计算的办法,直到 2009 年,Craig Gentry首次描述了全同态加密(FHE)的构建方案。这一突破最终使加密执行任意计算成为可能。

同态加密(HE)可分为三大类:

1.完全同态加密(FHE)

由Craig Gentry于2009年首次描述,FHE是一种加密类型,支持同一方案中的加法和乘法,并允许对加密数据执行任意深度的通用计算,而无需解密它。FHE 方案的流行示例包括具有自举功能变体的BGV[2]/ BFV[3],[4]/ CKKS[5], FHEW [6]和 TFHE[7]。FHE计划正在积极研究和开发,并正在进行标准化过程。

2.完全分级同态加密(FLHE)

也称为分级同态加密(LHE),它类似于FHE,但更具限制性,因为它允许有限的(或预定的)计算深度。流行的例子包括没有自举的BGV,BFV和CKKS。这些方案变体也在进行标准化审核。

3.部分同态加密(PHE)

这种形式的加密已经存在多年,它允许对加密数据进行加法或乘法(但不能两者兼而有之),而无需对其进行解密。PHE的流行例子是RSA[8]、Paillier密码系统[9]和 ElGamal 加密[10]方案。这三种方案是标准化的,在当今的生产环境中很常用。

从部分同态解决方案开始

 

FHE被认为是密码学的圣杯。数据在其整个生命周期,包括在静态、传输中以及计算时都保持加密状态。在 2009 年出现时,其计算开销被认为太慢,无法用于任何实际用途。从通用的角度,FHE在标准化和性能上仍然有所缺乏,因而许多用户在实现基于HE的实际应用程序时是有所保留的。而过去十年的发展已经开始释放同态加密的在实际应用中的潜力,特别是在那些受监管的行业以及那些保护数据的隐私和机密性至关重要的行业。

时代在发展,“坏人”也更老练了。因此,我们需要更安全的应用程序。现在,通过与英特尔的合作,我们可以使用基于硬件加速的部分同态加密方案来解决性能差距,以更好地满足市场需求。

英特尔工程师开发了“Intel Paillier Cryptosystem Library”(IPCL)[12],这是第一个开源且符合 ISO 标准的Paillier 密码系统软件实现。IPCL 利用高级矢量扩展指令集 512 (AVX512) 和整数融合乘法累加 (IFMA) 功能,可以在第三代英特尔®至强®可扩展处理器上发挥它的优势。

IPCL被视为联邦学习解决方案中,有关隐私保护方面的安全标准化中的重要一步:通过IPCL,联邦学习可以在保证高性能的条件下,使用Paillier加密系统在计算过程满足数据隐私保护法规。现在,英特尔与 VMware 合作,将该核心技术以及打包和管理一起集成并发布,使其成为一个完整、易于部署的解决方案。该合作将帮助 VMware构建更好的基于 HE的产品和方案。

在 KubeFATE 中试验 IPCL

VMware  CTO办公室部门的前沿技术团队(Advanced Technology Group, ATG)开发了KubeFATE[13],它是一种企业级的、可在 Kubernetes 上为数据中心构建联邦学习的解决方案。作为开源项目Federated AI Technology Enabler (FATE,目前托管在 LF AI & Data 基金会)[14]的一部分,KubeFATE用于管理跨组织的基础设施和服务。

FATE实现了基于同态加密(HE)和多方计算(MPC)的安全计算协议。通过将 IPCL 与 FATE 集成,KubeFATE在最新的英特尔处理器上运行时可以享受性能提升。IPCL 中的关键数学函数利用英特尔 AVX512 实现 SIMD 并行性,利用整数融合乘加 (IFMA) 指令集加快处理速度。有关该加速方案的更多详细信息,请参阅之前的一篇文章[15]。

下图显示了将 IPCL 集成到 FATE 中时更细节的各层组件的关系。此新功能已经在 FATE v1.9 版本中以预览形式发布。在这其中使用了IPCL in Python库(即图中的IPCL Python Wrapper)来方便 IPCL 与基于 Python 的框架的集成。

精选博客系列|加速基于同态加密的隐私保护机器学习

展望不久的将来

英特尔和VMware曾合作为变电站引入虚拟化技术,并共同在美国电网现代化方面取得了巨大进步[16]。这个现代化过程的下一个需求就是整合下一代加密方案,例如HE和后量子密码学。

电网系统是非常适合这种现代化发展的,除此之外,供水和下水道系统也是(现代化进程的)主要候选者。此类关键基础设施的管理者也在寻找方法来遵守新的安全和隐私法案,如加州消费者隐私法案(CCPA)[17]、欧盟通用数据保护条例 (GDPR)[18]和白宫行政命令14028[19]。

除了公用事业之外,应用了多云技术的企业也在积极寻找采用这些技术的方法,以确保其最关键的业务数据安全。据分析公司普华永道(PwC)称:这些公司正在积极寻找机会利用人工智能解决方案来分析敏感数据集,以做出更快的业务决策并获得新的见解[20]。Gartner 将隐私增强计算列为 2022 年第三大最重要的战略趋势[21]:

“隐私增强计算可以保护在不受信任的环境中处理个人数据——由于不断变化的隐私和数据保护法律以及消费者日益增长的担忧,这一点变得越来越重要。隐私增强计算利用各种隐私保护技术,允许从数据中提取价值,同时仍满足合规性要求。”

我们正处于不断探索同态加密(包括部分同态加密和完全同态加密)在解决实际问题的用法旅程的初期。接下来,我们将围绕同态加密构建解决方案,并利用英特尔的其他开源库(如 HEXL 和英特尔同态加密工具包)进行加速。

内容来源|公众号:VMware 中国研发中心