文件名称:elasticdl:Kubernetes原生深度学习框架
文件大小:5.15MB
文件格式:ZIP
更新时间:2024-02-25 10:31:35
kubernetes distributed-systems deep-learning tensorflow KubernetesPython
ElasticDL:Kubernetes原生的深度学习框架 ElasticDL是一个基于TensorFlow 2.0的Kubernetes原生深度学习框架,支持容错和弹性调度。 主要特点 弹性调度和容错 通过Kubernetes原生设计,ElasticDL支持容错并与Kubernetes的基于优先级的抢占一起实现深度学习任务的弹性调度。 TensorFlow 2.0急切执行 分布式深度学习框架需要在模型更新之前了解局部梯度。 Eager Execution允许ElasticDL做到这一点,而无需干预图执行过程。 简约界面 给定一个与Keras API定义,与一个命令行分布式训练模型。 el