文件名称:设计假设和目标-Hadoop介绍
文件大小:12.67MB
文件格式:PPT
更新时间:2024-05-16 04:06:43
hadoop hadoop入门 大数据学习 大数据 大数据
设计假设和目标 硬件错误:数量众多的廉价机器使得硬件错误成为常态。 数据流访问:应用以流的方式访问数据;设计用于数据的批量处理,而不是低延时的实时交互处理。放弃全面支持POSIX。 大数据集:典型的HDFS上的一个文件大小是G或T数量级的,支持一个云中文件数量达到千万数量级。 简单的相关模型:假定文件一次写入多次读取。未来可能支持Appending-write的模型。 移动计算比移动数据便宜:一个应用请求的计算,离它操作的数据越近就越高效。 多种软硬件平台中的可移植性