物联网概论(IoT)_Chp7 物联网数据与计算/Google大数据/云计算

时间:2024-05-20 20:53:58

Chp7 物联网数据与计算

大数据(Big Data):无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。

一般而言,大数据是指在一定的时间范围内无法用常规软件工具进行获取、存储、管理和分析的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

数据的量级

数据的大小用计算机存储容量的单位来表示。比特(bit),字节(Byte),TB、PB、EB(艾字节)、ZB、YB。
物联网概论(IoT)_Chp7 物联网数据与计算/Google大数据/云计算
数据产生的主体:
物联网概论(IoT)_Chp7 物联网数据与计算/Google大数据/云计算

Google技术“三件宝”——大数据的技术起源

1.谷歌公司的三大技术

谷歌的两位创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)。2003~2004年,谷歌发表了关于GFS、MapReduce和BigTable的3篇论文。谷歌发明了GFS、MapReduce和Big Table三大技术,也奠定了大数据和云计算两个领域的基础。

2.Google文件系统(GFS)

Google文件系统(Google File System,GFS)是Google公司为了存储海量搜索数据而设计的专用文件系统。

GFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。GFS运行于廉价的普通硬件上,并提供容错功能。GFS的出现改变了之前海量数据的存储必须依靠昂贵硬件和复杂运营的状况。

3.MapReduce

MapReduce是一种超大集群上并行计算的编程模型,也是一个用于处理和生成超大数据集(大于1TB)的作业调度。MapReduce架构的程序能够在大量普通配置的计算机上实现并行化处理,实现的项目包括大规模的算法图形处理、文字处理、数据挖掘、机器学习等。
物联网概论(IoT)_Chp7 物联网数据与计算/Google大数据/云计算

4.BigTable

Big Table是Google设计的分布式数据存储系统,是用来查询和处理海量数据的一种非关系型数据库。Big Table是一个稀疏的、分布式的、持久化存储的多维度排序映射,能快速、可靠地处理PB级别数据,并且能够部署到上千台机器上。

云计算

云计算的概念

1.云计算的定义

云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。

2.云计算的层次架构

云计算核心服务通常可以分为三个子层:基础设施即服务层(laaS,Infrastructure as a Service)、平台即服务层(PaaS,Platform as a Service)、软件即服务层(SaaS,Software as a Service)。
物联网概论(IoT)_Chp7 物联网数据与计算/Google大数据/云计算

1.基础设施即服务(laas)传统的应用需要分析系统的资源需求,也即需要确定基础架构所需的计算、存储、网络等设备规格和数量。云基础架构是在传统基础架构的基础上,增加了虚拟化层和云层。

2.平台即服务(Paas)

如果以传统计算机架构中“硬件+操作系统/开发工具+应用软件”的观点来看待,云计算的平台层应该提供类似操作系统和开发工具的功能。PaaS将开发环境作为服务向用户提供,用户主要是应用程序的开发者,用户在Paas提供的在线开放平台上进行软件开发,从而推出用户自己的Saas产品或应用。

3.软件即服务(Saas)

SaaS是最常见的一类云服务,它通过互联网向用户提供简单的软件应用服务及用户交互接口。用户通过标准的Web浏览器,就可以使用互联网上的软件,用户按订购的服务多少和时间长短付费(也可能是免费)。当前典型的Saas有多种,例如,在线邮件服务、网络会议、在线杀毒等。