数据,已经成为同土地、劳动力、资本、技术同等重要的生产要素,数字经济蓬勃发展的背后,是数据在提供核心驱动力。
数据基础设施是传统IT基础设施的延伸,以数据为中心,服务于数据,最大化数据价值,而数据存储作为数据基础设施基石,是释放数据新价值的金钥匙。
围绕数据的采-存-算-管-用,数据基础设施在实际应用当中,在边缘、中心、云等方面都面临着诸多挑战,那么我们该如何迎接挑战,最大限度的释放数据价值呢?
下面是华为数据存储与机器视觉产品线副总裁张福鹏在2020 IDC中国数字化转型年度盛典上的核心观点。从数据基础设施面临的6大挑战及华为的解决方案,带你深入了解华为在数据基础设施领域的创新与探索。
挑战一
数据采集——行业标准的缺失、功能的单一,使传统智能摄像机无法满足市场需求
华为解决方案
华为“软件定义摄像机HoloSens SDC”通过软件能力不断迭代升级,快速满足行业高速发展,业务多样化的需求
摄像机是边缘侧最重要的数据采集和处理设备,智能摄像机在5年前就已经出现了,在实际的运用当中,由于行业标准的缺失,智能摄像机的落地使用困难重重。
一方面,海量的智能分析需求与日俱增,各厂家接口并不统一,客户无法*选择与更新,再加上传统模式功能单一,因此往往需要通过部署多个摄像机来解决多应用场景的需求。另一方面,传统智能摄像机也面临着软件无法在线升级、刷机方案导致码流长时间中断、损失监控数据等难题,让智能进程一直受阻。
华为提出了“软件定义摄像机HoloSens SDC”的全新理念,以专业AI硬件、开放的操作系统、丰富的生态体系来定义智能时代下的安防摄像机的全新架构。快速满足行业高速发展,业务多样化的需求,通过软件能力赋予摄像机不断迭代演进的生长能力。
· 专业的AI硬件
算力是智能的基础,专业AI硬件提供强算力的支撑。通过专用硬件加速可支撑深度学习神经网络万亿级计算视觉处理,轻松实现如目标分类和属性识别等能力,甚至可以完全取代后端服务器来完成视频全量特征结构化,让全网智能分析效率最大化。
· 开放的操作系统SDC OS
软件与硬件解耦,可以屏蔽底层硬件的差异化,统一调用底层硬件的计算和编排能力、统一由操作系统封装,软件只需要聚焦功能侧的能力开发,降低了开发的复杂度。同时,通过轻量化容器技术构建面向多算法的集成框架,让各算法独立运行在一个虚拟的空间上,相互间互不影响,实现快速的独立加载与在线更迭。
· 丰富的生态体系
匹配行业场景细分、环境多样化的特点,华为“软件定义摄像机HoloSens SDC”可以大量匹配行业属性的长尾算法,这些算法根植于行业生产流程,具备快速上线、持续演进、按需使用的能力,解决客户实际问题。
挑战二
视频数据存储效率低、数据价值挖掘率低
华为解决方案
华为将智能化引入视频存储,空间更省、数据可靠性更高、智能化更强 行业数字化采集的数据中60%都是视频数据,因此对于视频数据的存储与处理尤为重要。随着视频数据量的增加,如何更加高效的把视频数据存储下来是首先要解决的问题。同时,当前视频数据中价值数据仅占37%,数据价值也还有待进一步挖掘。
华为将智能化引入视频存储,与传统视频存储方案相比,存储空间更省、数据可靠性更高、智能化更强。
传统视图编解技术以AVS3、H.265、H.266为主,华为采用智能编解码技术,如最小可觉察误差(JND)算法、基于感兴趣区域(ROI)的压缩算法可以做到更高的数据压缩,同时解析精度不变。在数据可靠性方面,华为通过EC算法,可以做到5个9的可靠性;同时,通过算力下沉,华为可以做到90%以上的边缘智能覆盖,是目前市场平均水平的6倍。
挑战三
实时数据存储与利用——25%的数据需实时处理,且年增长高达31%,需要超高性能存储
华为解决方案
华为通过高速互联协议、分布式可靠性、全局分级等创新,打造具有大规模、高性能、高可靠、易使用等关键能力的下一代超高性能存储
据IDC预测,到2025年,全球将有25%的数据是实时数据,年增长高达31%。这些数据需要超高性能存储,以满足实时计算高性能诉求。过去,实时数据存储在内存,但由于制程工艺限制,内存容量年增长率仅18%,大幅低于数据增长量。高速增长的实时数据与内存容量的矛盾凸显,所以,需要打破当前IT内存/存储边界,打造内存级大容量存储系统。
同时,实时数据还不能孤立,必须与历史数据融合,才能完全发挥数据价值,也即“流批融合”。如实时风控,需要实时转账数据与历史交易记录融合分析,才能更精准识别电信欺诈等风险。所以,超高性能存储,必须属于一个完整存储解决方案,而非孤立系统。
华为通过高速互联协议、分布式可靠性、全局分级等创新,打造具备大规模、高性能、高可靠、易使用等关键能力的下一代超高性能存储。
大规模:远超内存容量,单集群数百TB级;
高性能:尽量接近内存性能,10µs级;
高可靠:完备可靠性方案,持平企业级存储系统;
易使用:无感知的数据生命周期管理能力,与容量存储配合,数据最优放置,TCO更优。
挑战四
存储专用网络改造缓慢,成为全IP化的最后障碍
华为解决方案
华为将业界领先的存储与网络技术结合打造增强型NOF网络方案 随着数据爆发增长,数据中心规模不断扩大,在网络侧,利用IP技术在扩展性、性能、成本等方面优势推进网络全IP化,成为发展潮流。
一方面,传统IP技术不能满足存储对低时延、高稳定性的诉求,存储专用网络改造缓慢,成为全IP的最后障碍,如iSCSI技术2003年标准化,已有17年历史,但其时延比专用网络低30%以上,长期以来只能用于非核心场景。
另一方面,随着面向实时计算的超高性能存储出现,网络时延在整体时延的占比,从5.7%飙升至75%,现有专用网络性能瓶颈效应凸显,两套网络并存,带来更高的管理、运维复杂度。
2014年出现的NVMeover Fabric技术,针对存储系统进行专门设计,已经初步具备改造存储专用网络的能力,但在成熟度上,距全面可用仍有一段距离。
华为将业界领先的存储与网络技术结合,全栈协议增强,推出存储网络智能发现、故障快速感知、拥塞控制等技术创新,打造增强型NOF网络方案,实现了与传统专用网络匹配的易用性和稳定性,同时提供了更高的性能。
未来,华为将继续积极与伙伴合作,共同推进NOF网络的成熟,加速落地数据中心全IP化。
挑战五
数据孤岛现象明显,无法满足多元化业务诉求
华为解决方案
华为通过DME构筑统一的数据底座,使能数据按需流动 一方面,传统的存储建设以烟囱式为主,面向单一应用,无法全局共享,调度资源,存储整体利用率较低,且不同存储系统需要配备不同技能的管理人员,导致人均管理容量低小于1PB,管理成本较高。
另一方面,数据被锁定在不同的孤岛内,无法基于业务负载变更灵活迁移,一切依赖手工,面对不同的云管平台,不同存储各自提供接口支持对接,标准不统一,对接工作量大。
越来越多的客户意识到,在智能时代,打破存储孤岛,构建统一的数据底座,才能满足日益增多的多元化业务诉求。
华为通过DME构筑统一的数据底座,覆盖数据全生命周期场景,实现按需供给,解决以上问题,构建统一的数据存储底座。
基于华为智能数据引擎DME统一调度,把数据放在合适的位置,全局共享,按需供给,利用率可以提升到70%+;提供统一的数据底座,采用一套标准SLA体系规划,增强了自动化和智能化能力,人均管理容量超过了10PB;基于数据冷热和应用负载分析,自动化执行数据的按需流动,满足不同生命周期阶段性能成本诉求;
一套API+对接客户现有云管平台、虚拟化、容器环境,极简融入客户流程,不改变客户习惯。
在云时代,面对企业数据中心的多云环境,华为存储通过开放架构,实现多云连接和融合;
将多样化存储设备形成统一资源池,并通过行业标准API接口,实现一池连接多云,打破多云烟囱;将数据保护等丰富的存储企业级能力与云融合,增强云服务的高可靠能力,实现优势互补。
挑战六
边缘部署分散,管理、第三方生态应用部署、AI推理训练协同困难
华为解决方案
华为通过完善的边云协同机制,使能边缘业务生态系统,从智能走向智慧
当前边缘侧还处于单点智能处理的基础阶段,存在三大痛点:
· 边缘部署分散、管理协同难
交通/银行/电力/水利等边缘节点由于部署在数据中心以外,散落分布区域广,管理困难,目前大部分采用人工巡检模式进行管理;
· 第三方生态应用部署协同难
不同的行业需要广泛的生态合作伙伴进行业务使能,云端的生态合作伙伴当前缺乏与边缘侧的协同通道,支持生态应用的灵活加载、一键部署;
· AI推理训练协同难
AI算法是需要不断迭代训练和更新升级的,边缘侧的推理服务和云端的训练平台当前缺乏有效AI协同,导致算法固化,难以持续迭代优化;
华为通过完善的边云协同机制,真正使能边缘业务生态系统,从智能走向智慧。
· 管理协同
远程站点可视化管理、支持自动发现,扫码开箱即用;支持在线灰度升级维护、故障远程定位;支持分权分域权限管理。
· AI协同关键能力
算法云上训练、在线训练速度快;算法在线加载更新、适配多种边缘异构算力。
· 应用协同
边缘生态上云,一点集成,边缘下载即用;云端智能算法与前端感知能力业务协同,价值数据提取,降低数据搬运成本。