文件名称:Triton Inference Server提供了针对NVIDIA GPU优化的云推理解决方案。-Python开发
文件大小:5.09MB
文件格式:ZIP
更新时间:2024-06-14 07:04:15
Python Deep Learning
NVIDIA TensorRT Inference Server注:您当前位于master分支上,该分支跟踪开发到下一个版本的进度。 TensorRT Inference Server的最新版本是0.8.0 beta,而NVIDIA Triton Inference Server的最新发布:您目前位于master分支上,该分支跟踪着开发方面的最新进展。 Triton Inference Server的最新版本是1.13.0,可在分支r20.03.1上获得。 Triton V2:从20.06版本开始,Triton移至版本2。master分支当前跟踪V2的开发,由于从V1到V2的过渡过程中发生了重大变化,因此它可能比平时更加不稳定。 旧版V1版本