AWS推出专为机器学习设计的开发环境SageMaker Studio

时间:2024-11-17 10:11:40

AWS推出机器学习整合开发环境Amazon SageMaker Studio,开发者可以利用整合视觉接口撰写程序代码、追踪实验、可视化数据,并进行除错和监控。AWS提到,Amazon SageMaker Studio是第一个专为机器学习设计的整合开发环境。SageMaker已经发展了一段时间,但AWS认为,机器学习的工具相对于服务仍然不成熟,使得机器学习开发工作流程不够顺畅,许多功能像是除错器、项目管理、协作和监控等功能,在传统软件开发中都有相对应的工具,但是在机器学习中却没有。

而这使得机器学习的开发受到阻碍,像是当开发新算法,或是调整超参数的时候,研究人员通常需要在Amazon SageMaker中进行大量的实验,不过因为没有适当的工具支持,因此开发人员需要手动管理这些实验,而随着模型的发展,追踪工作只会越来越困难。为此,AWS开发Amazon SageMaker Studio整合所有机器学习开发所需要的工具,而且由于机器学习流程的追踪,都在同一环境中进行,因此开发人员可以在各步骤中来回切换,还能复制、调整和回放,提供开发人员快速调整进行迭代的能力,缩短机器学习解决方案开发的时间。

Amazon SageMaker Studio总共包含了数项主要功能,包含Notebooks、Experiments、除错器、模型监视器和Autopilot。Amazon SageMaker Notebooks目前仍在预览阶段,是AWS提供的增强版Jupyter Notebooks,可让用户创建和共享Jupyter Notebooks,不需要管理基础设施,还能快速地切换到不同的硬件配置。用户可以使用SageMaker Experiments来组织、追踪和比较不同的机器学习工作,这些工作包含训练、数据处理和模型评估,让用户可以方便地进行实验。除错器(下图)则能让用户除错和分析复杂的训练问题,该功能会自动检查用户的模型、收集数据并进行分析,提供实时警示和建议。

模型监视器则可以侦测已部署模型的质量误差,在需要的时发出警示,并以可视化的方式呈现误差。Autopilot则能自动建构模型,包括自动选择算法、数据预处理、模型调整以及控制基础设施,而在自动化建置的过程,还给用户完全的控制和可见度。这项服务目前只先在美东的俄亥俄州地区开放。