统计学与大数据分析.docx

时间:2022-12-24 16:01:35
【文件属性】:

文件名称:统计学与大数据分析.docx

文件大小:26KB

文件格式:DOCX

更新时间:2022-12-24 16:01:35

文档资料

统计学与大数据分析 作者:刘 静 来源:《现代经济信息》 2018年第17期 摘要:由于互联网和信息技术的快速发展,数据已然成为新世纪的巨大经济资产和矿产资源。为各个领域带来了新的方向与变革,当今最受关注的学科不是经济学,也不是医学,而是能够运用大数据进行相关分析的统计学。企业带来统计学与大数据分析迎合了时代的发展,定将展现出光明的前景。 关键词:统计学;大数据;利用;发展 中图分类号:C829.2? ? ? 文献识别码:A? ? ? 文章编号:1001-828X(2018)025-0058-02 信息时代的来临使得大数据技术在全球范围内获得了很大的发展,对于*统计机关来说大数据使用了多种数据收集模式,对各种数据进行整合而且通过现代信息技术以及高速处理的挖掘数据,发挥了自己的应用价值与决策支持功能,一方面,统计调查主体的多元化发展和电子商务的发展给统计数据的发展带来了很大的难题。会对*统计管理*以及统计理念产生影响,另一方面,因为计算机技术以及网络信息技术的飞速发展,它在提高统计生产力方面发挥着重要作用。大数据是官方统计部门要研究的方向,在这种情况下,分析大数据在*统计中的效果,了解*统计改革和发展的机会对*统计具有重要意义。虽然近代统计学获得了很大的发展,但是大数据时期的来临暴露了统计学方面的问题,在抽样调查设计,数据管理以及统计分析等方面,数据分析都颠覆了传统的统计方式。 一、古代统计学时代 众所周知,关于统计学的分类有很多,但是最主要的包括三种类型的统计学方法。第一,可以处理不定期事件的统计方法,例如概率统计法;第二,可以处理定期事件的统计方法,例如比值编制、调查研究等方法;第三,能够处理跨学科领域的相关联的统计方法,例如应用技术统计方法等。 由于数据收集以及数据处理受到一定的约束,所以人们很难获取较为全面的数据信息,这就使得古代的统计学方法基础几乎都是从一些可取的样本上获得的。 或者可以通过其他的一些途径得到数据信息,但是如果从客观条件考虑,可能需要付出很大的成本,所以人们会放弃获取全部的具体数据。面对这种情形,人们常常会去经过长时间的筛选,选择一个相对而言较好的统计方法,但这也仅仅是反映了总体当中的某一个小的方面的具体特点。然而,我们所观察到的这些数据特征占总体大量数据特征的比例甚小,很多的其他数据特点有待发现。 总而言之,统计学是在抽样理论的基础上发展而来的,统计学分析方法较为强调具有因果关系的统计分析结果,能够根据部分数据去推测整体。统计学是通过搜集数据、整理、分析数据等过程进而得出数据内在规律的一门学科。统计学最常用的方法就是样本抽取方法,根据抽取的局部数据去推测整体,进而得出事物的总体发展走势的综合性学科。 二、现代统计学时代 统计学与大数据分析全文共4页,当前为第1页。 乔治华盛顿大学的 Jeremy S.Wu 教授以其丰富的实践经验提到了现代治理统计 2.0 的概念。与统计 2.0 相比,胡善清教授说,现代统计是 1.0 时代。并且非随机数据是没有研究价值的。 统计学与大数据分析全文共4页,当前为第1页。 1. 利用所有的数据 在原始统计中,由于没有很多用于记录,存储和分析的工具,因此仅对整体进行样本分析。由于统计学的目标是通过最少数据证明发现,统计学家认为,采样分析的准确性因为随机性的增加而增加, 但是,它与样品数量的增加几乎没有关系。就像经济学中边际递减效应一样。 在大数据时代,没有使用随机分析的原理,并且使用了所有大数据。 即"样本 = 总体"。统计抽样的目标主要是为了技术受限的过程中,可以更好的解决相关的问题而出现的,慢慢的又会将样本分析抛弃。 2. 接受不精确 对于小数据,统计数据可以更好地处理数据,但在大数据时代,大量数据使统计方法成为问题。 随着数据量的增加导致结果出现问题,对准确性的强调是信息时代和模拟时代的产物,但是接受不涉及的区域的不准确性,接受不准确是从"小数据"到"大数据"的重要转变之一。由于数据量相对较大所带来的准确性,可以接受不准确的问题,以获得大规模数据的好处,混乱就是一种新的方法,所以不能够避免。 3. 追求相关关系而不是确定因果 在小数据期间,也存在相关性。在其中找到具体的定量规律,人们在实践中学到变量之间存在两种关系:函数关系和相关关系。相关以及回归就是处理变量的方法。变量之间出现的不确定量之间的关系也称为相关性。通常,可以通过散点图和相关系数来分析相关性。 相关性的目标是量化数据之间的逻辑关系。知道是什么就行了。通过探索"什么"而不是"为什么",这种关系可以让我们更好地了解世界,如果凡事有因果,那么就没有决定任何事情的*。 4. 数据的来源并非那么简单 一般来说,为了获得需要的数据就要通过不同的方式测量,才能获得记录。但是数据会在意想不到的地方获得,虽然


网友评论