大数据时代的思考.doc

时间:2022-12-24 15:07:10
【文件属性】:

文件名称:大数据时代的思考.doc

文件大小:29KB

文件格式:DOC

更新时间:2022-12-24 15:07:10

文档资料

大数据时代的思考 作者: 来源:《软件和信息服务》2013年第02期 大家都说用数据说话,但数据多到不可理解,怎么办?大数据时代的变革又触 发你怎样的思考?这本书或许能为你答疑解惑。 工业化时代,一切需要用数据说话;黄仁宇的《万历十五年》,说*最大 的问题是不能以数目说话,帝国许多的决策是想当然,并认为是帝国千年无法快速发展 的原因。其实,幅员辽阔的帝国治理在许多时候,还是用数字说话的,只是关键是数据 承载和传递的方式,使得许多数据无法使用。 就是到今天,我们老百姓也很难相信堂堂国家统计局的报告数字,不知道能说 明什么意思? 在计算、存储和传送成本快速下降的云时代,这些不再为个人所能理解的数据 将会变得如何,计算机系统会开启什么样的视角?人们的思考、工作以及存在的机遇在 哪里? 维克托·迈尔- 舍恩伯格和肯尼斯·库克耶所著的《大数据时代(生活、工作与思维的大变革)》为我们整 理了这方面的思路。 作者之一维克托·迈尔- 舍恩伯格,是牛津大学互联网治理与监管教授,曾在亚洲新加坡国立大学担任教学研究 岗位,对大数据时代特征颇有研究;而另一位作者肯尼斯·库克耶则是多个国际期刊和频 道的技术评论员,先后供职于如华尔街日报、国际先驱论坛报以及经济学人等。 作者以Google在2009年成功预测新型H1N1流感流行为引子开始全文,这种结合 禽流感和猪流感病毒特征的新型流感在流感流行几周前,谷歌就成功预测出将出现这样 的流感,这是因为谷歌系统中可以检测出诸如"哪些是治疗咳嗽和发热的药物"问题的密 集出现区域,结合其他特征提前进行预告。 这是一个引人注目的开头,当数据应用和普罗大众的生活紧密结合时,大众的 信息的确可以反应出许多以前很难关注的问题。在这方面美国和欧洲的确走在了世界的 前面。例如在医药领域中,对于某一个品名或品次的药品不良反应很快可以形成某种警 示,对民众和厂家都是一种保护,当然这需要一个良好的数据监控和公布制度,这方面 我们中国就弱了许多。 作者告诉我们在新的大数据时代,将会在三个方面有所不同,这也是本书的核 心部分。 其一:"不是随机样本,而是全体数据",因为有了技术的能力,我们可以看到 全部数据的总和,从DNA基因全息分解,找到应对于每个人特质的基因疗法(就是利用健 康的基因来填补或替代基因疾病中某些缺失或病变的基因,乔布斯因此延长了生存期) ,到记录六万四千场的比赛中,看出为什么在临界点上的运动员将会有不同的表现、反 应。 其二:"不是精确性,而是混杂性",数据将不只是归纳结论的基础,更将成为 修正结论的依据,同时大数据量的特征将会让许多进化算法具有更强的生命力,而不是 一开始就设计复杂的算法,其实并不能适应大数据的环境。这有点像人民并不需要一个 复杂设计精巧的管理机构,如果有一些简单的原理和方式,也许自治类的管理将是效率 和成本的解决方案。 其三:"不是因果关系,而是相关关系",在逻辑推理课程以及许多管理学课程 时,老师最喜欢和我们说的话是不要将时间先后性作为因果推导,陷入不可理喻的反智 主义中。 不过,作者告诉我们,现实世界中许多的关联关系我们无法揭示,这种不被揭 示的相关关系又有可能有很好的商业价值,因此从大数据推导来的相关关系能对此进行 挖掘。 嗯,这是一个很好的说法。 不过这样的说法确实很危险,想一想股市,由于和每一个人投入的金钱相关, 所以数据统计的表达和分析,有了几十年的历史,但是在这种羊群理论作用的无意识环 境中,大数据量有多少价值呢,看看LongCapital两个诺贝尔经济学家的折戟沉沙就知道 ,盲目相信相关性,其实是相当危险的。 作者继而用"数据、技术与思维"三个维度阐述在大数据时代下人们的机遇,数 据是资源,是需要制造、管理和整理的,技术是发掘的手段,而思维是前面讲的三个数 据特征对政治、经济和生活的影响,很好!这是一个不错的维度,就看我们如何做了。 这是一本典型的Internet时代的著作,在出版时序上,国内中文版和国际版本 同步推出;在整体逻辑上,涵盖多个角度、多维度,许多例子真真假假,多少让人眼花 缭乱;看完后,仔细想想,其实作者也未必将每一件事情想得明白,不过Internet的数 据是提供思考和触发思考,并不是提供一个现实的结论,这正是大数据时代的特征。读 读看,你会看到什么? ----------------------- 大数据时代的思考全文共2页,当前为第1页。 大数据时代的思考全文共2页,当前为第2页。


网友评论