概述
大数据是当今时代的潮流,是后IT时代的一个浪潮,最近学校开了这门mooc,想把所学记录下来,一是分享、二是以后备用
大数据的定义与特点
什么是大数据?
至今没有公认的定义
定义一
所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息
定义二
不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法
定义三
“大数据”是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化力的海量、高增长率和多样化的信息资产
大数据有多大
这个了解一下就行哈,确实挺大==!就是我们人类所不能企及的计算力量,让计算机辅助来完成
大数据的应用范围
到处都是,社交网络的信息统计、科学探测(让计算机去收集信息他就会没完没了的干活,他能收集到多少数据可想而知)、商业数据(一天的资本流动能量估计能赶上好几次卫星爆炸了==!,尤其是女孩子们)、计算机艺术(阿凡达等电影的拍摄加特效会用到大量的数据)
大数据特点
就是这样,我们要考虑如何在尽短的时间内完成对巨大的数据的分析,而这些数据又必须是有价值的才值得我们分析
大数据的应用
应用范围很广,比如一些推荐、一些科学的数据分析、一些预测
大数据算法
大数据上问题求解计算问题的过程
我们这节课的内容集中在算法的设计与分析上
诶,突然发现一个问题
突然发现这个直接把ppt拷贝过来就能讲的很清楚了,我只要略带说明就可以了==!(ppt不让下载,要不就分享出来了)
就是说大数据很高大上,由于数据量之巨大我们就必须采用很多技巧,而一些技巧可以大大简化计算过程但会造成一点误差,我们知道分析这个东西本来就会造成误差,能算出来总比算不出来好,所以,我们会采用这种方法,至于算法的细节会在以后的课程中有讲解
这些算法就是我们要学习的课程
尾声
这就是第一节课的大概内容,我们主要了解了什么是大数据,以及我们日后要学习的课程=w=
每日一句
“我们有两个方法来进行软件设计:一个是让其足够的简单以至于让BUG无法藏身;另一个就是让其足够的复杂,让人找不到BUG。前者更难一些” — C.A.R. Hoare