文件名称:clusterdata:阿里生产集群采集的集群数据,用于集群管理研究
文件大小:16.22MB
文件格式:ZIP
更新时间:2024-08-23 19:24:12
dataset JupyterNotebook
阿里巴巴集群追踪计划 概述 阿里巴巴集群追踪计划由阿里巴巴集团发布。 通过提供来自实际生产的集群跟踪,该计划帮助研究人员、学生和对该领域感兴趣的人更好地了解现代互联网数据中心 (IDC) 的特征和工作负载。 到目前为止,已经发布了三个版本的trace: cluster-trace-v2017在 12 小时内包含大约 1300 台机器。 trace-v2017 首先介绍了在线服务(又名长时间运行的应用程序)和批处理工作负载的搭配。 要查看有关此跟踪的更多信息,请参阅相关文档 ( )。 完成简短调查后即可获得下载链接()。 cluster-trace-v2018在 8 天内包含大约 4000 台机器。 除了具有比 trace-v2017 更大的缩放器外,这条 trace 还包含我们生产批次工作负载的 DAG 信息。 更多详情请查看相关文档( )。 调查后提供下载链接(不到一分钟,)。
【文件预览】:
clusterdata-master
----cluster-trace-v2017()
--------trace_201708.md(11KB)
--------SHA256SUM(83B)
--------schema.csv(3KB)
--------README2017.md(1KB)
--------sigma.png(133KB)
----cluster-trace-v2018()
--------sigma-fuxi-collocation.jpg(2.56MB)
--------.DS_Store(6KB)
--------DAG.png(375KB)
--------trace_2018.md(8KB)
--------schema.txt(7KB)
----README.md(8KB)
----cluster-trace-gpu-v2020()
--------data()
--------analysis()
--------LICENSE(18KB)
--------README.md(17KB)
--------figures()