deepops:用于构建GPU集群的工具

时间:2024-05-09 17:54:53
【文件属性】:

文件名称:deepops:用于构建GPU集群的工具

文件大小:8.06MB

文件格式:ZIP

更新时间:2024-05-09 17:54:53

Shell

DeepOps GPU基础架构和自动化工具 概述 DeepOps项目封装了部署GPU服务器群集和共享单个功能强大的节点(例如 )的最佳实践。 DeepOps也可以进行调整或以模块化方式使用,以匹配特定于站点的集群需求。 例如: NVIDIA DGX服务器的本地数据中心,DeepOps在其中提供了端到端功能来设置整个群集管理堆栈 运行Kubernetes的现有集群,其中DeepOps脚本用于部署Kubeflow和连接NFS存储 需要资源管理器/批处理调度程序的现有集群,其中DeepOps用于安装Slurm,Kubernetes或两者的混合 一台不需要调度程序的机器,仅需要NVIDIA驱动程序,Docker和NVIDIA Container Runtime ,了解如何使用DeepOps在单个DGX Station上部署Kubernetes和Kubeflow。 这为大型部署提供了良好的基础


网友评论