导读 本文主要分享 Datacake 在大数据治理中,AI 算法的应用经验。本次分享分为五大部分:第一部分阐明大数据与 AI 的关系,大数据不仅可以服务于 AI,也可以使用 AI 来优化自身服务,两者是互相支撑、依赖的关系;第二部分介绍利用 AI 模型综合评估大数据任务健康度的应用实践,为后续开展数据治理提供量化依据;第三部分介绍利用 AI 模型智能推荐 Spark 任务运行参数配置的应用实践,实现了提高云资源利用率的目标;第四部分介绍在 SQL 查询场景中,由模型智能推荐任务执行引擎的实践;第五部分展望了在大数据整个生命周期中,AI 的应用场景。
全文目录:
1. 大数据与 AI
2. 大数据任务健康度评估
3. Spark 任务智能调参
4. SQL 任务执行引擎智能选择
5. AI 算法在大数据治理中的应用展望
分享嘉宾|李卫民 快乐茄 算法工程师
编辑整理|Charles
出品社区|DataFun
③ 任务治理完成之后取得了多大的收益,有多少提升,同样可以通过分数得到量化的展示。
06
Q6:sigmoid 2022 有一些参数调优相关的文章,有进行参考吗?