文件名称:大数据的国内外研究现状与发展动态分析报告.doc
文件大小:38KB
文件格式:DOC
更新时间:2022-12-23 22:20:58
文档资料
大数据的国内外研究现状及发展动态分析 大数据的概念 产生的背景与意义 上世纪60年代到80年代早期,企业在大型机上部署财务、银行等关键应用系统,存储 介质包括磁盘、磁带、光盘等。尽管当时人们称其为大数据,但以今日的数据量来看, 这些数据无疑是非常有限的。随着PC的出现和应用增多,企业内部出现了很多以公文档 为主要形式的数据,包括Word、Excel文档,以及后来出现的图片、图像、影像和音频等 。此时企业内部生产数据的已不仅是企业的财务人员,还包括大量的办公人员,这极大 地促进了数据量的增长。互联网的兴起则促成了数据量的第三次大规模增长,在互联网 的时代,几乎全民都在制造数据。而与此同时,数据的形式也极其丰富,既有社交网络 、多媒体等应用所主动产生的数据,也有搜索引擎、网页浏览等被动行为过程中被记录 、搜集的数据。时至今日,随着移动互联网、物联网、云计算应用的进一步丰富,数据 已呈指数级的增长,企业所处理的数据已经达到PB级,而全球每年所产生的数据量更是 到了惊人的ZB级。在数据的这种爆炸式增长的背景下,"大数据"的概念逐渐在科技界、 学术界、产业界引起热议。在大数据时代,我们分析的数据因为"大",摆脱了传统对随 机采样的依赖,而是面对全体数据;因为所有信息都是"数",可以不再纠结具体数据的 精确度,而是坦然面对信息的混杂;信息之"大"之"杂",让我们分析的"据"也由传统的 因果关系变为相关关系。 大数据热潮的掀起让中国期待"弯道超越"的机会,创造中国IT企业从在红海领域苦苦 挣扎转向在蓝海领域奋起直追的战略机遇。传统IT行业对于底层设备、基础技术的要求 非常高,企业在起点落后的情况下始终疲于追赶。每当企业在耗费大量人力、物力、财 力取得技术突破时,IT革命早已将核心设备或元件推进至下一阶段。这种一步落后、处 处受制于人的状态在大数据时代有望得到改变。大数据对于硬件基础设施的要求相对较 低,不会受困于基础设备核心元件的相对落后。与在传统数据库操作层面的技术差距相 比,大数据分析应用的中外技术差距要小得多。而且,美国等传统IT强国的大数据战略 也都处于摸着石头过河的试错阶段。中国市场的规模之大也为这一产业发展提供了大空 间、大平台。大数据对于中国企业不仅仅是信息技术的更新,更是企业发展战略的变革 。随着对大数据的获取、处理、管理等各个角度研究的开展,企业逐渐认识数据已经逐 渐演变成"数据资产"。任何硬件、软件及服务都会随着技术发展和需求变化逐渐被淘汰 ,只有数据才具有长期可用性,值得积累。数据是企业的核心资产,可以是也应该是独 立于软硬件系统及应用需求而存在的。大数据是信息技术演化的最新产物,确立了数据 这一信息技术元素的独立地位。正因为数据不再是软硬件及应用的附属产物,才有了今 天爆炸式的数据增长,从而奠定了大数据的基础。为了充分利用数据资产,大数据产业 也呼之欲出。大数据时代来临,使商业智能、信息安全和云计算具有更大潜力。大数据 产业链按产品形态分为硬件、基础软件和应用软件三大领域,商业智能、信息安全和云 计算主横跨三大领域,将构成产业链中快速发展的三驾马车。就国内而言,商业智能市 场已步入成长期,预计未来3年复合年均增长率( CAGR) 为35%,"十二五"期间潜在产值将超300 亿元; 信息安全预计未来3 年CAGR有望保持35% ~ 40%的快速增长,"十二五"期间潜在产值将超4000 亿元; 云计算刚进入成长期,预计未来5 年CAGR 将超50%,2015 年产业规模预计将达1 万亿元。大数据处理的基础设施数据仓库、以物联网为代表的数据收集环节、实时性强 的在线数据分析工具,以及数据可视化的产品呈现,数据挖掘的应用在营销、销售、人 力资源、电子商务等各个商业领域广泛开展,大数据为个性化营销和精准化推荐提供了 充足的养分和可持续发展的沃土。同时大数据研究会给企业管理变革带来巨大冲击。对 现代企业的管理运作理念、组织业务流程、市场营销决策以及消费者行为模式等产生巨 大影响,使得企业商务管理决策越来越依赖于数据分析而非经验甚至直觉。大数据将催 生由信息驱动的的商业模式,在企业的价值链中发挥中间作用,通过商业交易创建极具 价值的"排出数据";数据驱动的决策制定,利用可控实验,企业能够验证假设、分析结 果以指导投资决策及运作改变;利用大数据进一步提高算法和机器分析的作用,避免成 本高昂的人工干预,节约成本,提高效益。 国内外研究进展 "大数据"这个概念早在上个世纪的1980年,著名未来学家阿尔文·托夫勒便在《第三次 浪潮》一书中,就将"大数据"热情地赞颂为"第三次浪潮的华彩乐章"。2008年9月《科学》 (Science)杂志发表了一篇文章"BigData: Science in the Petabyte Era"。"大数据"这