文件名称:大数据多租户的概念-大数据是什么?带你1分钟了解大数据的概念!.pdf
文件大小:195KB
文件格式:PDF
更新时间:2022-12-24 12:30:13
文档资料
⼤数据多租户的概念_⼤数据是什么?带你1分钟了解⼤数据的 概念! ⼤数据本⾝是⼀个抽象的概念。从⼀般意义上讲,⼤数据是指⽆法在有限时间内⽤常规软件⼯具对其进⾏获取、存储、管理和处理的数据集 合。 ⽬前,业界对⼤数据还没有⼀个统⼀的定义,但是⼤家普遍认为,⼤数据具备 Volume、Velocity、Variety 和 Value 四个特征,简 称"4V",即数据体量巨⼤、数据速度快、数据类型繁多和数据价值密度低,如图 1 所⽰。下⾯分别对每个特征作简要描述。 图 1 ⼤数据特征 1) )Volume:表⽰⼤数据的数据体量巨⼤。 :表⽰⼤数据的数据体量巨⼤。 数据集合的规模不断扩⼤,已经从 GB 级增加到 TB 级再增加到 PB 级,近年来,数据量甚⾄开始以 EB 和 ZB 来计数。 例如,⼀个中型城市的视频监控信息⼀天就能达到⼏⼗ TB 的数据量。百度⾸页导航每天需要提供的数据超过 1-5PB,如果将这些数据打 印出来,会超过 5000 亿张 A4 纸。图 2 展⽰了每分钟互联⽹产⽣的各类数据的量。 图 2 互联⽹每分钟产⽣的数据 2) )Velocity:表⽰⼤数据的数据产⽣、处理和分析的速度在持续加快。 :表⽰⼤数据的数据产⽣、处理和分析的速度在持续加快。 加速的原因是数据创建的实时性特点,以及将流数据结合到业务流程和决策过程中的需求。数据处理速度快,处理模式已经开始从批处理转 向流处理。 业界对⼤数据的处理能⼒有⼀个称谓——" 1 秒定律",也就是说,可以从各种类型的数据中快速获得⾼价值的信息。⼤数据的快速处理 能⼒充分体现出它与传统的数据处理技术的本质区别。 3) )Variety:表⽰⼤数据的数据类型繁多。 :表⽰⼤数据的数据类型繁多。 传统 IT 产业产⽣和处理的数据类型较为单⼀,⼤部分是结构化数据。随着传感器、智能设备、社交⽹络、物联⽹、移动计算、在线⼴告等 新的渠道和技术不断涌现,产⽣的数据类型⽆以计数。 现在的数据类型不再只是格式化数据,更多的是半结构化或者⾮结构化数据,如 XML、邮件、博客、即时消息、视频、照⽚、点击流、 ⽇ 志⽂件等。企业需要整合、存储和分析来⾃复杂的传统和⾮传统信息源的数据,包括企业内部和外部的数据。 4) )Value:表⽰⼤数据的数据价值密度低。 :表⽰⼤数据的数据价值密度低。 ⼤数据由于体量不断加⼤,单位数据的价值密 度在不断降低,然⽽数据的整体价值在提⾼。以监控视频为例,在⼀⼩时的视频中,有⽤的 数据可能仅仅只有⼀两秒,但是却会⾮常重要。现在许多专家已经将⼤数据等同于黄⾦和⽯油,这表⽰⼤数据当中蕴含了⽆限的商业价值。 根据中商产业研究院发布的《2018-2023 年中国⼤数据产业市场前景及投资机会研究报告》显⽰,2017 年中国⼤数据产业规模达到 4700 亿元,同⽐增长 30%。随着⼤数据在各⾏业的融合应⽤不断深化,预计 2018 年中国⼤数据市场产值将突破 6000 亿元达到 6200 亿元。 通过对⼤数据进⾏处理,找出其中潜在的商业价值,将会产⽣巨⼤的商业利润。