scout:AWS上Hadoop和Spark的大规模性能数据

时间:2024-06-06 09:59:23
【文件属性】:

文件名称:scout:AWS上Hadoop和Spark的大规模性能数据

文件大小:587.12MB

文件格式:ZIP

更新时间:2024-06-06 09:59:23

介绍 借助云计算,用户能够调整云配置以满足其性能或成本目标。 在我们的研究项目中,我们旨在为给定的工作量和目标确定最佳的云配置。 在研究过程中,我们发现很难找到性能数据-至少,我们找不到适合我们需求的性能。 相反,我们收集了所需的数据。 该数据存储库是您的努力。 我们提供这些数据来鼓励在云性能优化方面的研究进展。 该数据存储库包含AWS EC2上Hadoop和Spark应用程序的大规模性能数据。 由于性能随输入的不同而变化,因此我们的数据包括应用程序和输入的多种组合。 我们使用工作量来描述应用程序及其输入。 工作负载是从和中提取的。 我们在Amazon EC2的众多云配置上运行了这些工作负载。 每个配置均由虚拟机(VM)类型和许多相同的VM组成。 该数据存储库包括单节点设置和多节点设置。 单节点设置包括18种VM类型,多节点设置包括69种配置(9种VM类型和各种数量的VM)。 对于每


网友评论