微软发布云端基因服务:推动AI驱动的精准医疗
编者按:儿童癌症是很多研究者十分关注的问题,对相关数据的利用和处理无疑是解决问题的关键。
近日,微软宣布推出Microsoft Genomics服务,该服务通过帮助研究者利用和处理基因数据来取得治疗癌症等疾病的重大突破。这一基于云的工具让存储和计算庞大的基因数据成为可能。一起来看看吧!
本文译自Microsoft announces general availability of cloud-based tools for genomics research,有删减。
每年,全世界大约有175,000名14岁及以下的儿童被诊断出癌症,如何使用基因技术寻找出儿童癌症的治疗方法成为全世界研究者们十分关心的问题。
但由于所需的基因数据规模和数量过于庞大,人们很难为他们的研究找到合适的数据。如果全世界的研究者都能够轻松简单地获取并使用共享的基因组数据,这个医学难题是不是会更容易被攻破呢?
孟菲斯圣裘德儿童研究医院(St. Jude Children’s Research Hospital)的一个研究团队从2010年就开始将患者的健康和癌症细胞的匿名数据上传到了公共数据库,尝试通过推动全球研究机构数据共享的方法来寻找出儿童癌症的治疗方法。而当时,微软正在制定一个基于云的计算流程,用于对比数以百万计的原始基因数据和参考基因数据,进而探明它们之间的不同之处。因此,双方在这一领域展开了合作。
基于这项工作,微软近日宣布推出Microsoft Genomics服务。Microsoft Genomics服务通过利用和处理基因数据,来帮助医学研究者发明更精准地治疗癌症等疾病的药物。比如,通过分析患者的健康和肿瘤细胞组织以及其他患者的医疗数据(包括治疗方法和结果),医生能够选择最有效的治疗方案。
Microsoft Genomics团队
事实上,圣裘德儿童研究医院、微软以及DNAnexus(一个运营在Azure上的基因数据管理平台)三方基于共享基因数据以及Microsoft Genomics服务,合作开发了一套基因组比对和基因变异识别的流程。基于这套流程,合作者们已经处理了超过500TB的基因数据,并将其存储在Azure以供大家分析。对于研究医院、DNAnexus和微软正在合力建立的数据分享平台来说,这些数据分析结果提供了一个良好的基础。
Microsoft Genomics服务是微软Healthcare NExT的一部分,Healthcare Next是微软发起的通过人工智能和云计算来加速健康保健行业的创新。在拥有大量准确医疗数据的前提下,微软希望通过部署在云上的AI工具来帮助研究者更快地发现癌症等疾病的治疗方法。而一个处理基因数据的通用流程,可以有效降低可能影响数据的伪影和噪音,有助于AI驱动下的精准医疗。
单一人类基因组测序的成本已经从2001年的一亿美元降为如今的不到1000美元,成本的降低极大地加速了基因测序的商业化。据业内专家预测,到2025年,将会有超过1亿人的基因组被测序。大量的测序需求的出现对计算机的计算和存储能力提出了新的要求。
单个人类基因组数据约占用100GB的存储空间,需要花费个人笔记本电脑几百个小时来处理这些数据。而随着越来越多的基因组将被测序,存储需求将达到PB甚至EB级别(1TB=1024GB,1PB=1024TB,1EB=1024PB)。面对如此庞大数据量,个人电脑将无能为力。因此,拥有海量存储空间和强大计算能力的云成为基因数据处理的完美工具。
目前,Microsoft Genomics已经面向美国、西欧和东南亚的用户提供服务。由于基因数据处理通常会涉及到一系列法律和道德问题,为了保证数据的隐私和安全,Microsoft Genomics服务已经获得了ISO认证,这意味着其达到了国际安全、隐私和质量标准。该服务同样符合HIPAA(Health Insurance Portability and Accountability,健康保险携带和责任)法案标准,确保个人健康信息的安全使用。