【文件属性】:
文件名称:ml-azuredatabricks:Azure Databricks的机器学习示例集合
文件大小:1.58MB
文件格式:ZIP
更新时间:2021-02-01 16:18:23
machine-learning deep-learning azure databricks mlflow
使用Azure Databricks进行机器学习
易于入门的Azure Databricks中的机器学习示例集合
ML101示例笔记本: ,
高级示例笔记本: ,
Azure Databricks参考体系结构-机器学习和高级分析
主要优点:
专为企业打造,具有安全性,可靠性和可扩展性
从数据访问(ADLS,SQL DW,EventHub,Kafka等),数据准备,功能工程,在单节点或分布式中的模型构建,带有MLflow的MLop,与AzureML,Synapse和其他Azure服务集成的端到端集成。
Delta Lake将为下游ML和AI用例奠定更高数据质量,可靠性和性能的数据基础
ML运行时优化
可靠且安全地分发开源ML框架
打包并优化最常见的ML框架
内置的分布式深度学习优化
内置的AutoML和实验跟踪
使用conda的自定义环境可重现
分布式机器学习
火花MLlib
只需几行代码更改即可将单节点迁移到分布式:
分布式超参数搜索(Hyperopt,Gridsearch)
PandasUDF将模型分布在数据或超参数的不同子集上
考拉:Spark上的Pandas Da