文件名称:pytorch-operator:PyTorch是Kubernetes
文件大小:28.5MB
文件格式:ZIP
更新时间:2024-05-23 10:47:43
Jsonnet
用于PyTorch作业的Kubernetes自定义资源和操作员 概述 该存储库包含PyTorchJob自定义资源定义的规范和实现。 使用此自定义资源,用户可以像Kubernetes中的其他内置资源一样创建和管理PyTorch作业。 参见 先决条件 Kubernetes> = 1.8 安装PyTorch操作员 请参考的安装说明。 这将安装pytorchjob CRD和pytorch-operator控制器来管理PyTorch作业的生命周期。 创建一个PyTorch作业 您可以通过定义PyTorchJob配置文件来创建PyTorch作业。 有关请参见清单。 您可以根据需要更改配置文件。 cat examples/mnist/v1/pytorch_job_mnist_gloo.yaml 部署PyTorchJob资源以开始培训: kubectl create -f examples/mnist